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© Retrovirus aus der HIV-Gruppe und dessen Verwendung. 

© Offenbart wird ein neues Immunschwachevirus mit der Bezeichnung MVP-5180/91, das bei der European 
Collection of Animal Cell Cultures (ECACC) unter der Nr. V 920 92 318 hinterlegt wurde. Weiterhin offenbart 
werden die daraus erhaltlichen charakteristischen Antigene. die fOr den Nachweis von Antikorpern gegen 
Retrovirus, die mit Immunschwacheerkrankungen verbunden sind, eingesetzt werden kfinnen sowie die DNS- 
und AminosSuresequenz des Virus. 
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Die vorliegende Erfindung betrifft ein neues Retrovirus aus der HIV-Gruppe sowie Varianten oder Telle 
davon welche die wesentlichen Eigenschaften des Virus enthalten. Beschrieben wird ein Verfahren zur 
ZUchtung des Retrovirus. Die Erfindung betrifft weiterhin die Gewinnung dieses Retrovirus sow.e die 
Verwendung des Virus, seiner Teile oder Extrakte fUr medizinische Zwecke, fUr die Diagnostik und be. der 
Herstellung von Impfstoffen. 

Retroviren die zur sogenannten HIV-Gruppe gehoren. ftlhren bei damit infizierten Menschen zu 
Krankheitserscheinungen, die unter dem Sammelbegriff Immunschwache bzw. AIDS (Acquired Immune 
Deficiency Syndrome) zusammengefaBt werden. 

Epidemiologische Studien belegen. daB das Humane Immunschwache Virus (HIV) das aetiologische 
Agens fQr die uberwiegende Mehrheit der AIDS (Acquired Immune Deficiency Syndrome)-Faile darstellt. Ein 
1983 aus einem Patienten isoliertes und charakterisiertes Retrovirus erhielt die Bezeichnung HIV-1 (Barre- 
Sinoussi, F. et al.. Science 220, 868-871 [1983]). Eine Variante von HIV-1 wird in WO 86/02383 beschr.e- 

^" Eine zweite Gruppe von Humanen Immunschwache Viren wurde 1985 in Westafrika identifiziert (Clavel. 
F et al Science 233, 343-346 [1986]) und als Humanes Immunschwache Virus Typ 2 (HIV-2) bezeichnet 
(EP-A-0 239 425) HIV-2 Retroviren unterscheiden sich deutlich von HIV-1, weisen jedoch auch eine 
Verwandtschaft zu Affen Immunschwache Viren (SIV-2) auf. Wie HIV-1 fUhrt auch HIV-2 zu einer AIDS- 

Symptomat^^ ejneg |mmunschwgcne Retrovirus wird in der EP-A-0 345 375 beschrieben und 

20 dort als HIV-3 Retrovirus bezeichnet (ANT 70). . 

Auch in Lancet Vol. 340, Sept. 1992, S. 681-682 wird die Isolierung eines weiteren, varianten 

Immunschwachevirus beschrieben. w^i^ntst 
— ist ein Charakteristikum der Humanen Immunschwache Viren, daB sie eine hohe Vanabilitat 



T5 



Es 151 em v^iiaiaiMcuomvui" ... . . . 

aufweisen die die Vergleichbarkeit der verschiedenen Isolate deutlich kompliziert. Beim Vergleich d.verser 
HIV-1 -Isolate treten z.B. in einigen Regionen des Genoms hohe Variabilitaten auf, wahrend andere 
Genombereiche vergleichsweise konserviert vorliegen (Benn. S. et al. Science 230, 949-951 [1985)). Em 
wesentlich grSBerer Polymorphismus konnte auch fur HIV-2 beobachtet werden (Clavel, F. et al., Nature 
324 691-695 [1986]). Die grQBte genetische Stabilitat besitzen Bereiche in den gag und pol Genen, die fur 
strukturell und enzymatisch essentielle Proteine codieren; einige Regionen im env-Gen sowie die Gene (v.f, 
vpr tat rev nef). die fUr regulatorische Proteine codieren, zeigen einen hohen Grad an Vanabilitat. ts 
konnte weiterhin gezeigt werden, daB Antisera gegen HIV-1 auch mit gag und pol Genprodukten von Hiy-2 
kreuzreagieren, obwohl nur geringe Sequenzhomologie vorlag. Ebenfalls war die Hybridisierung zwischen 
diesen beiden Viren wenig signifikant, wenn nicht sehr wenig stringente Konditionen verwandt wurden 
(Clavel, F. etal., Nature 324, 691-695 [1986]). 

Aufgrund der weiten Verbreitung der Retroviren aus der HIV-Gruppe und der Tatsache, daB zwischen 
dem Zeitpunkt der Infektion und dem Zeitpunkt, zu dem eindeutige Symptome fUr pathologische Verande- 
rungen erkennbar sind, ein Zeitraum von einigen bis vielen Jahren (2-20) liegt, ist es epidemiologist von 
qroBer Bedeutung, die Infektion mit Retroviren der HIV-Gruppe moglichst frDhzeitig und vor allem zuverlas- 
sig zu bestimmen. Dies spielt nicht nur eine Rolle bei der Diagnose von Patienten, die Zeichen von 
40 Immunschwache aufweisen. sondern auch bei der OberprUfung von Blutspendern. Es hat sich herausge- 
stellt daB bei der Verwendung von Retroviren oder Bestandteilen davon des Types HIV-1 oder HIV-2 in 
Nachweissystemen bei manchen Seren kein oder nur ein schwacher Nachweis von Antikorpern gefuhrt 
werden kann, obwohl bei den Patienten, von denen die Seren stammen, Zeichen von Immunschwache 
auftreten. Mit Hilfe des erfindungsgemafien Retrovirus aus der HIV-Gruppe ist in bestimmten Fallen e.n 

45 derartiger Nachweis moglich. , „ , ... 

Beschrieben wird die Isolation und Charakterisierung eines neuen Humanen Immunschwache Virus, im 
folgenden als MVP-51 80/91 bezeichnet, das aus peripheren Lymphozyten einer 1991 34-jMhrigen Patientin 
aus Kamerun isoliert wurde, die Zeichen von Immunschwache aufwies. Geographisch stammt dieses 
Retrovirus aus einer Region in Afrika, die zwischen Westafrika mit endemischer HIV-2 und HIV-1 V.rus.nfek- 

50 tion und Ostzentralafrika mit fast ausschlieBlicher HIV-1 -Verbreitung lokalisiert ist. Gegenstand der vorlie- 
genden Erfindung ist also ein neues Retrovirus der HIV-Gruppe, welches als MVP-51 80/91 bezeichnet wird 
und dessen Varianten sowie davon abgeleitete DNS-Sequenzen und Aminosauresequenzen bzw. Te.lse- 
quenzen und diese enthaltende Test-Kits. Das Retrovirus MVP-51 80/91 wurde bei der European Collection 
of Animal Cell Cultures (ECACC) unter der Nummer V 920 92 318 gemSB den Bedingungen des 

55 Budapester Vertrages hinterlegt. . 

Ebenso wie HIV-1 und HIV-2 w3chst das erfindungsgem8Be MVP-5180/91 in folgenden Zellinien HUT 
78 Jurkat-Zellen, C8166-Zellen und MT-2-Zellen. Die Isolierung und Vermehrung von Viren wird in dem 
Bu'ch "Viral Quantitation in HIV Infection, Editor Jean-Marie Andrieu, John Libbey Eurotext, 1991" ausfUnr- 
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lich teschrieben. Die dort beschriebenen Arbeitsmethoden werden dutch Bezugnahme zum Gegenstand 
der Offenbarung der vorhegenden Anmeldung gemacht. 

b8S,t !!u ? as . erfindu "9 s 9emaBe Virus eine magnesiumabhangige Reverse Transkriptase. die 
aber n.cnt manganabhangig .st. Dies stellt eine weitere Gemeinsamkeit zu den Wen HIV-1 und HIV-2 dar 

Zum besseren Verstandnis der Unterschiede des erfindungsgemaBen MVP-51 80/91 Virus zu den 
STlir h T" ?' V " 2 S °" 2Un3ChSt kUfZ d8r AufbaU d6r ,mmun ^che verursachenden RetrovJen 
P ot?nlZ n e h n -t nn6ren d8S ^ b8,indet SiCh die RNA in einem kege.f5rmigen Core, das aus 
Prote.nunteremhe.ten zusammengesetzt ist, die die Bezeichnung p 24 (p fOr Protein) tragen. Dieses innere 

2Z riV 0 " ? ,n ° r .. Proteinhm,e Um 9 eben " die aus d ™ PraWn p 17 aufgebaut ist (auBeres Core) und von 

P T VT geben iSt - ^ " eben Upiden - die auS der Wirtszelle das Transmem" 

branprote.n gp 41 und das HUllprotein 120 (gp 120) enthalt. Dieses gp 120 kann dann mit den CdI 
Rezeptoren der Wirtszellen eine Bindung eingehen. 

Hon^H 11 ^ k ! nnt ' W6iSt dte RNA d6r H ' V " Viren ■ vereinfach * dargestellt - folgende Genbereiche auf: An 
den be.den Enden sogenannte long terminal repeats (LTR), und die folgenden Genbereiche gag. pol env 
und nef. Das Gen gag codiert unter anderem fur die Kern(Core)-Proteine, p 24 und p 17 das Gen ool 
codiert u a. fUr die Reverse Transkriptase. die RNAse H und die Integrase und das Gen env 'codiert fur die 
Glykoproteme gp 41 und gp 120 der VirushUlle. Das Gen nef codiert fUr ein Protein mit Regulatorfunktion 
Eine schematische Anordnung des Genomes von Retroviren des HIV-Typs ist in Figur 1 gezeigt 

Erne Unterscheidung zwischen den Retroviren HIV-1 und HIV-2 ist u.a. dadurch m6glich. daB virales 

S^ a M 9ete f te \r ird K«M^ einem monok,onalen AntikQrper. der kommerziell als Testkit von Abbott 
(HIVAG-1 Monoclonal erhalthch .st. und gegen das (HIV-1) p 24 gerichtet ist. Es ist bekannt. daB der Gehalt 
vL^nn Tr H anskr, P tase j" den Virustypen HIV-1 und HIV-2 etwa gleich ist. Wenn man deshalb in 

^^^Jf-'^^^"^ Vire " die EXtinkti0 " (E 490 nm) " erhalten durch die Antigen-Antikor- 
Z'i h r auft : a9t . 9e9e " d,e Akfivi «t de ' Rev ^sen Transkriptase. dann erhalt man eine Graphik, die 
etwa der F.gur 2 entspncht. Hierbei stellt man fest. daB im Verhaltnis zu dem Gehalt an Reverser 
Transknptase be. H.V-1 eine sehr hohe Bindungsaffinitat fUr p 24 mit dem eingesetzten monokSen 

Si J" T I 0 ' .™- 2 m da9e96n nUr 6ine Sehr 9eri " 9e Bindungsaffinitat ffir p 24 bei 
w2nt h m ° noklonalen Anfkorpers wiederum bezogen auf den Gehalt an Reverser Transkriptase auf. 
Werden d.ese Messungen durchgefuhrt fUr MVP-5180/91, dann befindet sich die Kurve ziemlich genau in 
oLn mvpIi^o? 6 ' o7 6 V ° n H ' V " 1 U " d H,V " 2 ' d h - die Bind «"9saffinitat des monoklonalen AnLrpers 
SrtT P u 4 ' St 9e9enUber H,V " 1 reduzie * no» 2 zeigt schematisch diesen SachveLt 

I ™JJ V 5 ! T ranskr, P tase bedeutet und * Antigen (Ag) das Protein p 24 eingesetzt wird. gegen das 
der monoklonale Anbkorper, der in dem von Abbott kSuflich erwerblichen Testkit vorhanden ist. gerichtet ist 
rhain'l^ r I V6rwendbares Svstem der Gentechnologie ist die sogenannte PCR (polymerase 
^*° n Oeworden. vvobei die zur DurchfOhrung des Verfahrens benotigten Komponenten kauflich 

dZ^Z Z \^ die r m e Verfahren iSt 68 m59liCh - DNA -SeP"enzen zu amp.ifizieren. wenn 

Fr»l 7 ^, zuam P hf,z,erenden Se q"«^ bekannt sind. Es mussen dann kurze komplementare DNA- 
< 0, ' 9 °"" ceot,de = Primer ) synthetisiert werden, die sich an einen kurzen Bereich der zu 
amplrf.z.erenden Nukle.nsauresequenz anlagern. FOr die Testdurchfuhrung werden HIV-Nukleinsauren mit 
den Pnmern zusammengebracht in einer Reaktionsmischung, die zusatzlich eine Polymerase und Nukleo- 
.dtr^hosphate enthatt. Die Polymerisation (DNA-Synthese, wird fur eine bestimmte Zeit durchgefOhrt und 
dann werden d.e Nukle.nsaurestrange durch Erwarmen getrennt. Nach AbkUhlen lauft dann die Polymerisa- 
*on erneut an. Wenn es sich also bei dem erfindungsgemaBen Retrovirus urn ein HIV-1 Oder HIV-2 Virus 
handelt. dann muBte die NukleinsSure amplifiziert werden kfinnen. indem Primer verwendet werden die 
konserv.ert smd mnerhalb der bekannten Sequenzen der Viren HIV-1 und HIV-2. Derartige Primer sind 'zum 
Te.l vorbeschneben (Laure. F. et al.. Uncet ii. (1988) 538-541 fOr pol 3 und pol 4 bzw Ou CY et 7 
Science 239 (1988) 295-297 fOr sk 38/39. sk 68/69). ' 

SeqSnz^eisen- heraUS9e,Unden ' daB bei Verwendung von bestimmten Primerpaaren. die folgende 
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(Seq. ID No. 1-14) 
HIV-1 

gaga: CTACT AGTAC CCTTC AGG 

gagb: CGGTC TACAT AGTCT CTAAA G 

sk38: CCACC TATCC CAGTA GGAGA A 

Slc39: CCTTT GGTCC TTGTC TTATG TCCAG AATGC 



pol3: TGGGA AGTTC AATTA GGAAT ACCAC 
pol4: CCTAC ATAGA AATCA TCCAT GTATT G 

pol3n: TGGAT GTGGG TGATG CATA 
pol4n: AGCAC ATTGT ACTGA TATCT A 



SK145: AGTGG GGGGA CATCA AGCAG CC 
SK150: TGCTA TGTCA CTTCC CCTTG GT 

145-P: CCATG CAAAT GTTAA AAGAG AC 
150-P: GGCCT GGTGC AATAG GCCC 



35 Oder eine Kombination von pol3 und pol4 mit 

UNI-1: GTGCT TCCAC AGGGA TGGAA 
UNI-2: ATCAT CCATG TATTG ATA 

roonehower LA et al. (1990) J. Virol. Methods 28, 33-46) 

und da PCR ml nested primer schwache Amplifikate der MVP-5180/91-DNA erhalten wurden. 

KeLe Oder nur schwache Amplifikate im Vergleich zum HIV-1 , die evtl. auf Verunrem.gungen zuruckzu- 
fUhren sind, wurden erhalten mit folgenden Primer-Sequenzen: 
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(Seq. ID No. 15-34) 

tat 1 AATGG 
tat 2 TGTCT 

tat IP GAGCC 
tat 2P GGAGA 



AGCCA GTAGA TCCTA 
CCGCT TCTTC CTGCC 

CTGGA AGCAT CCAGG 
TGCCT AAGGC TTTTG 
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enva: TGTTC CTTGG GTTCT TG 

envb: GAGTT TTCCA GAGCA ACCCC 

sk68: AGCAG CAGGA AGCAC TATGG 

sk69: GCCCC AGACT GTGAG TTGCA ACAG 



5v3e: GCACA GTACA ATGTA CACAT GG 
3v3e: CAGTA GAAAA ATTCC CCTCC AC 
25 5v3degi: TCAGG ATCCA TGGGC AGTCT AGCAG AAGAA G 

3v3degi: ATGCT CGAGA ACTGC AGCAT CGATT CTGGG TCCCC TCCTG AG 
3v31ongdegi: CGAGA ACTGC AGCAT CGATG CTGCT CCCAA GAACC CAAGG 
3v31ongext: GGAGC TGCTT GATGC CCCAG A 
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gagdi: TGATG ACAGC ATGTC AGGGA GT 
pol e: GCTGA CATTT ATCAC AGCTG GCTAC 

Im Vergleich zum HIV-1 schwache Amplifikate, die jedoch die gleiche Intensitat wie das verwendete HiV-2 
Isolat (MVP-1 1971/87) aufwiesen, wurden erhalten mit 



gag c: TATCA CCTAG AACTT TAAAT GCATG GG 

gag d: AGTCC CTGAC ATGCT GTCAT CA 

env c: GTGGA GGGGA ATTTT TCTAC TG 

45 env d: CCTGC TGCTC CCAAG AACCC AAGG. 

Eine weitverbreitete Methode zum Nachweis von HIV-Antikorpern ist der sogenannte Western Blot 
(Immunoblot). Dabei werden die viralen Proteine gelelektrophoretisch aufgetrennt und dann auf eine 
Membran Uberfuhrt. Die mit den UberfUhrten Proteinen versehenen Membranen werden dann mit Seren der 
zu untersuchenden Patienten in Verbindung gebracht. Sofern Antikorper gegen die viralen Proteine 
vorhanden sind, binden diese an die Proteine. Nach Waschen verbleiben lediglich spezifische Antikorper 
gegen virale Proteine. Die Antikorper werden dann mit Antiantikorpern sichtbar gemacht, die regelmaBig mit 
einem Enzym gekoppelt sind, das eine Farbreaktion katalysiert. Auf diese Weise konnen die Banden der 
viralen Proteine sichtbar gemacht werden. 

Das erfindungsgemaBe Virus MVP-51 80/91 weist gegentlber den Viren HIV-1 und HIV-2 im Western 
Blot zwei signifikante wesentliche Unterschiede auf. Das HIV-1 zeigt regelmaBig eine starke Bande, die dem 
Protein p 24 zuzuordnen ist und eine sehr schwache, oft kaum sichtbare Bande. die dem Protein p 23 
zuzuordnen ist. HIV-2 weist eine kraftige Bande auf, die dem Protein p 25 zuzuordnen ist und manchmal 
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eine schwache Bande, die dem Protein p 23 zuzuordnen ist. Im Unterschied dazu weist das erfindungsge- 
mSBe MVP-51 80/91 Virus zwei etwa gleich starke Banden auf, die den Proteinen p 24 und p 25 
entsprechen. 

Ein weiterer signifikanter Unterschied besteht bei den Banden, die der Reversen Transkriptase zuzuord- 
5 nen sind HIV-1 zeigt eine Bande (p 53), die der Reversen Transkriptase entspricht und eine Bande (p 66), 
die der Reversen Transkriptase verbunden mit der RNAse H entspricht. Bei HIV-2 entspricht die Reverse 
Transkriptase dem Protein p 55 und, wenn sie mit der RNAse H verbunden ist, dem Protein p 68. Das 
erfindungsgemaBe MPV-51 80/91 weist dagegen eine Bande auf bei dem Protein p 48, die der Reversen 
Transkriptase entspricht, und eine Bande, bei dem Protein p 60, die der Reversen Transkriptase in 
w Verbindung mit RNAse H entspricht. 

Aus diesen Ergebnissen kann geschlossen werden, daB die Reverse Transkriptase des MVP-5180/91 
ein Molekulargewicht hat, das zwischen etwa 3 und etwa 7 Kilodalton kleiner ist als das der Reversen 
Transkriptase von HIV-1 bzw. HIV-2. Die Reverse Transkriptase von MPV-51 80 weist also ein Molekularge- 
wicht auf, das zwischen etwa 4.500 Dalton und etwa 5.500 Dalton kleiner ist als die Reverse Transkriptase 

75 von HIV-1 bzw. HIV-2. 

Es wurde herausgefunden, daB mit Hilfe des erfindungsgemaBen Virus MVP-5180/91 anti-env-Antikor- 
per in Seren von deutschen Patienten, die Zeichen von Immunschwache zeigen, nur schwach nachgewie- 
sen werden konnen, wobei die Seren aber stark reagieren, wenn anstelle des erfindungsgemaBen Virus ein 
HIV-1 Virus verwendet wird. Diese starkere Nachweisreaktion wurde vor allem lokalisiert in dem gp 41 
20 Protein. Bei den Versuchen wurden Serumpanels gegenUbergestellt, die einmal von deutschen Patienten 
stammen und zum anderen von afrikanischen Patienten mit Zeichen von Immunschwache stammen. 

Die oben angegebenen Charakteristika kennzeichnen solche Virus-Varianten, die dem erfindungsgema- 
Ben MVP-5180/91 entsprechen. Wenn also aus heparinisiertem Spenderblut, das von Personen stammt. die 
Immunschwacheanzeichen aufweisen und vorzugsweise aus Afrika stammen, Immunschwacheviren isoliert 
werden, dann kann auf diese Weise das erfindungsgemSBe Virus Oder Varianten davon erhalten werden. 

Da das Virus isoliert wurde, welches die oben erwShnten Eigenschaften aufweist, kann die Klonierung 
einer cDNA auf folgendem Weg durchgefUhrt werden: Das Virus wird aus einer entsprechend groBen 
Kulturmenge (etwa 1 I) prSzipitiert und in phosphatgepufferter Kochsalzlosung aufgenommen. Dann erfolgt 
eine Pelletierung durch ein (20 %iges) Saccharose-Kissen. Das Viruspellet kann in 6 M Guanidiniumchlond 
in 20 mM Dithiothreitol und 0,5 % Nonidet P 40 suspendiert werden. CsCI wird bis auf eine Konzentration 
von 2 molar zugegeben und die das aufgebrochene Virus enthaltende Losung wird auf ein CSsiumchlorid- 
Kissen aufgebracht. Dann wird die virale RNA durch Zentrifugation pelletiert, gelost, mit Phenol extrahiert 
und mit Ethanol und Lithiumchlorid prSzipitiert. Mit Hilfe eines Oligo(dT)-Primers wird die Synthese des 
ersten cDNA-Stranges an der viralen RNA Oder Teilen davon durchgefUhrt. Die Synthese unter Zugabe von 
Reverser Transkriptase kann durchgefOhrt werden unter Verwendung eines kSuflich erhSltlichen Kits. Fur 
die Synthese des zweiten Stranges wird der RNA-Strang des RNA/DNA-Hybrids mit RNase H verdaut und 
der zweite Strang unter Einsatz von E.coli DNA Polymerase I synthetisiert. Mit Hilfe von T4 DNA 
Polymerase k6nnen dann stumpfe Enden erzeugt werden und diese mit geeigneten Linkem fUr Restnktions- 
schnittstellen verbunden werden. Nach Restriktionsverdau mit der geeigneten Restriktionsendonuklease wird 
das cDNA-Fragment aus einem Agarosegel isoliert und mit einem vorher in geeigneter Weise geschnittenen 
Vektor ligiert. Der Vektor mit dem cDNA-lnsert kann dann zur Transformation von kompetenten E.coh-Zellen 
verwendet werden. Die erhaltenen Kolonien werden dann auf Membranen Ubertragen. lysiert und denaturiert 
und schlieBlich durch Hybridisierung mit Digoxigenin Oder Biotin markierter Nukleinsaure aufgefunden. Nach 
gentechnologischer Herstellung der entsprechenden cDNA ist eine Isolierung der gewunschten DNA- 
45 Fragmente. die aus dem Retrovirus stammen, m5glich. Durch Einbau dieser Fragmente in geeignete 
Expressionsvektoren kann dann das gewUnschte Protein bzw. Proteinfragment exprimiert werden und fUr 
die diagnostischen Tests eingesetzt werden. 

Alternativ zu der angegebenen Methode kann das Immunschwachevirus mit Hilfe der PCR-Technologie 
kloniert werden, wobei die oben angegebenen Primer Verwendung finden kQnnen. 
so Zwischen verschiedenen Virusisolaten kann die Ahnlichkeit ausgedrUckt werden durch den Grad der 
Homologie der Nucleinsaure- oder Proteinsequenzen. Eine 50 %ige Homologie bedeutet beispielsweise, 
daB 50 von 100 Nucleotid- oder Aminosaure-Positionen in den Sequenzen Obereinstimmen. Die Homologie 
von Proteinen wird durch Sequenzanalyse bestimmt. Homologe DNA-Sequenzen lassen sich auch durch die 
Hybridisierungs-Technik ermitteln. 
55 ErfindungsgemaB wurde zunachst ein Teil aus dem HUllprotein sequenziert und festgestellt, daB diese 
Sequenz nur eine verhaltnismSBig geringe Homologie zu den entsprechenden Sequenzen von V.ren vom 
HIV-Typ aufweist. Insbesondere bezogen auf den gp 41-Bereich wurde durch einen Vergleich mit HIV- 
Sequenzen, der mit Hilfe von Datenbanken durchgefUhrt wurde, eine Homologie von hSchstens 66 % 
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(Nucleotidsequenz) ermittelt. 

Es wurde weiterhin der Bereich sequenziert, der fOr gp 41 kodiert. Diese Sequenz ist in Tabellen 1 bzw 
3 dargestellt. 

Gegenstand der vorliegenden Erfindung sind daher solche Viren, die eine Homologie von mehr als 66 
%, bevorzugt 75 % und besonders bevorzugt 85 % aufweisen zu dem erfindungsgemaBen HIV- Virus MVP 
5180/91, bezogen auf die Nucleotidsequenz der Tabelle 1 und/oder der Tabelle 3. 

Weiterhin sind Gegenstand der vorliegenden Erfindung solche Viren, die eine Homologie von mehr als 
66 %, bevorzugt 75 % und besonders bevorzugt 85 % aufweisen zu Partialsequenzen der in Tabelle 3 
dargestellten Nucleotidsequenz, die wenigstens 50, bevorzugt 100 Nucleotide lang sind. Dies entspricht 
emer Lange der Peptide von wenigstens 16 und bevorzugt von wenigstens 33 Aminosauren. 

Das erfindungsgemaBe Virus unterscheidet sich durch seine Sequenz von vorbekannten Viren Gegen- 
stand der vorliegenden Erfindung sind daher solche Viren sowie entsprechende DNS- bzw. Aminosaurese- 
quenzen, die der Sequenz des erfindungsgemaBen Virus weitgehend entsprechen, wobei der Grad der 
Abwe.chung durch den Grad der Homologie festgelegt wird. Eine Homologie von beispielsweise mehr als 
85 % bedeutet daher, daB solche Sequenzen umfaBt werden, die in wenigstens 85 von 100 Nucleotiden 
bzw. Aminosauren dieselben Nucleotide bzw. Aminosauren aufweisen. wahrend der Rest unterschiedlich 
sein kann. Bei der Feststellung der Homologie werden die beiden Sequenzen derart gegenubergestellt daB 
moghchst viele einander entsprechende Nucleotide bzw. AminosSuren miteinander zur Deckung kommen 

Die (nahezu) vollstandige Sequenz, angegeben als DNS-Sequenz des erfindungsgemMBen Virus ist in 
Fig. 4 wiedergegeben. Gegenstand der vorliegenden Erfindung sind dabei Viren, die die Sequenz gemSB 
Fig. 4 aufweisen sowie Varianten davon, die eine hohe Homologie zu der Sequenz von Fig. 4 aufweisen 
sow.e davon abgeleitete Proteine, Polypeptide und Oligopeptide, die diagnostisch verwendbar Oder als 
Impfstoff einsetzbar sind. 

Anhand der isolierten Sequenz konnen immundominante Epitope (Peptide) konfektioniert und syntheti- 
s.ert werden. Da die NucleinsMuresequenz des Virus bekannt ist. kann der Fachmann hieraus die Aminosau- 
resequenz ableiten. Ein Teilbereich der Aminosauresequenz ist in Tabelle 3 angegeben. Gegenstand der 
vorliegenden Erfindung sind daher auch Antigene, d.h. Proteine, Oligo- oder Polypeptide, die mit Hilfe der 
in Figur 4 bzw. Tabelle 3 offenbarten Information hergestellt werden konnen. Diese Antigene, Proteine 
Polypeptide und Oligopeptide weisen Aminosauresequenzen auf, die von Figur 4 abgeleitet werden konnen 
bzw. in Tabelle 3 angegeben sind. Die Antigene bzw. Peptide kSnnen verhaltnismaBig kurze Teilsequenzen 
emer Aminosauresequenz aufweisen, die in Tabelle 3 wiedergegeben ist Oder aus Figur 4 abgeleitet werden 
kann. Diese Aminosauresequenz ist wenigstens 6 Aminosauren, bevorzugt wenigstens 10 und besonders 
bevorzugt wenigstens 15 Aminosauren lang. Hergestellt werden kSnnen diese Peptide nicht nur mit Hilfe 
der rekombinanten Technologie sondern auch durch synthetische Methoden. Ein geeigneter Herstellungs- 
weg | ist die Festphasensynthese vom Merrifield-Typ. Eine weitere Beschreibung dieser Technik und anderer 
im Stand der Technik bekannter Verfahren kann in der Literatur gefunden werden. z.B. M. Bodansky et al 
Peptide Synthesis, John Weeley & Sons, 2nd Edition 1976. 

Bei den diagnostischen Tests wird eine Serumprobe der zu untersuchenden Person zusammengebracht 
mit den Prote.nketten von einem oder mehreren Proteinen oder Glykoproteinen (die in eukaryontischen 
Zellinien expr.rn.ert werden konnen) oder Teilen davon, die von MVP-51 80/91 stammen Bevorzugte 
Testverfahren schlieBen die Immunfluoreszenz oder immunenzymatische Testverfahren (z.B. Elisa Immuno- 
blot) ein. 

Bei den immunenzymatischen Tests (ELISA) kann beispielsweise Antigen, das von MVP-51 80/91 oder 
emer Variante davon stammt, an den Wanden von Mikrotiterplatten gebunden werden. Die dabei verwende- 
te Dosierung hangt von dem Testsystem und der Behandlung der Mikrotiterplatten wesentlich ab. Dann wird 
Serum bzw. SerumverdQnnungen. die von der zu untersuchenden Person stammen, in die Locher der 
Mikrotiterplatten gegeben. Nach einer bestimmten Inkubationszeit wird die Platte gewaschen und spezifi- 
sche Immunkomplexe werden nachgewiesen durch AntikSrper, die spezifisch an menschliche Immunglobu- 
line binden und die vorher mit einem Enzym, beispielsweise Meerrettichperoxidase, alkalischer Phosphata- 
se usw. verbunden wurden oder mit enzymmarkiertem Antigen. Diese Enzyme konnen ein farbloses 
Substrat in ein stark gefSrbtes Produkt umwandeln und an der Starke der Farbung kann dann das 
Vorhandense.n von spezifischen Anti-HIV-Antikorpern abgelesen werden. Eine weitere Moglichkeit der 
Verwendung des erfindungsgemaBen Virus in Testsystemen ist die Verwendung in Western Blots 
Auch wenn die Herstellung von Impfstoffen gegen Immunschwacheerkrankungen sich als SuBerst schwierig 
erweist, kann doch auch dieses Virus bzw. Teile davon, d.h. immundominante Epitope und Induktoren der 
zellularen Immunitat. oder gentechnologisch hergestellte Antigene zur Entwicklung und Herstellung von 
Impfstoffen verwendet werden. 
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Belsplel 1 

Das erfindungsgemSBe Immunschwache-Virus MVP-51 80/91 wurde aus dem Blut einer Patientinmit 
Zeichen von Immunschwache isoliert. Hierzu wurden periphere mononukleare Zellen (peripheral blood 
lymphocytes, PBL) und periphere Lympho Z yten aus dem Blut (PBL) eines nicht HlV^nfiz.erten Spenders 
mtt Phytohamagglutinin stimuliert und in Kultur gehalten. Verwendet wurde hierzu das Ubliche Medium 
RPMI 1640 mit 10 % fStalem Kalberserum. Die Kulturbedingungen sind beschrieben in Landay A. et al.. J. 
Inf Dis 161 (1990) S. 706-710. Beobachtet wurde dann die Bildung von Riesenzellen unter dem 
MikroskopTDie Produktion von HIV-Viren wurde Ober die Bestimmung des p 24-Antigensm.t H.lfe des 
kauflich erwerbbaren Tests von Abbott bestimmt. Ein weiterer Test zur Bestimmung des Wachstums der 
Viren war der Test unter Verwendung von partikelgebundener Reverser Transknptase (Eberle J., Se.bl R. J. 
Virol Methods 40. 1992, S. 347-356). Das Wachstum der Viren wurde also anhand der enzymatischen 
Aktivitaten im KulturUberstand ein- bis zweimal pro Woche bestimmt. urn die V.rusproduktion zu uberwa- 
chen. WSchentlich einmal wurden neue Spenderlymphozyten zugegeben. 

Nachdem eine HlV-V.renvermehrung festgestellt werden konnte. wurden frische periphere Lymphozyten 
aus dem Blut (PBL) nicht HIV-infizierter, gesunder Spender mit dem Uberstand der ersten Kuftur .nf.z.ert 
Dieser Schritt wurde wiederholt und dann wurden mit dem Oberstand H 9 bzw. HUT 78 Zellen .nf.z.ert. Au 
diese Weise war eine permanente Produktion des Immunschwache-Virus moglich. Das V.rus wurde be. der 
ECACC unter der Nr. V 920 92 318 hinterlegt. 

Beisplel 2 

Zum Nachweis von HIV-lnfektionen ist derzeit der sogenannte Western Blot oder Immunoblot ein 
Standardverfahren. GemaB der in J. Virol. Meth. 15 (1987) S. 11-23 von GQrtler et al. beschr.ebenen 
Vorgehensweise wurden verschiedene Seren untersucht. Hierbei wurden Seren von deutschen Patienten 
solchen Seren gegenUbergestellt, die von afrikanischen Patienten erhalten wurden. Es wurden h.erbe. 

folgende Ergebnisse erhalten: 



30 
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Virustyp 


deutsche Seren 


afrikanische Seren 


HIV-1 , Virus isoliert von 
deutschem Patienten 
MVP-51 80/91 


starke Reaktion 

keine bis schwache Reaktion mit gp 41 


starke Reaktion mit gp 41 
starke Reaktion 



Die oben dargestellten Ergebnisse zeigen, daB ein aus deutschen Patienten isoliertes V.rus vom HIV-1 
Typ wenn es zum Nachweis von HIV-lnfektionen verwendt wird, moglicherweise ke.ne *ndeut.gen 
Ergebnisse liefert, wenn der Patient infiziert wurde mit einem Virus, das dem erfindungsgemaSen MVP- 
5180/91 entspricht. Es wird dabei davon ausgegangen, daB mit Hilfe des erfindungsgemaBen V.rus solche 
Viren nachgewiesen werden konnen, die wenigstens etwa 85 % Homologie. bezogen auf das Gesamtge- 
nom, zu dem erfindungsgemaBen Virus aufweisen. 
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Beispiel 3 

GemaB der in Beispiel 2 angegebenen Vorgehensweise wurden weitere Western Blots durchgefUhrt. 
Die Ergebnisse sind in der anliegenden Figur 3 dargestellt. Bei diesem Test wurde einmal das wale Prote.n 
des erfindungsgemaBen Immunschwache-Virus MVP-51 80/91 und einmal das v.rale Prote.n e.nes HIV-1 - 
Tvd Virus (MVP-899) gelelektrophoretisch aufgetrennt und dann auf Zellulosefilter transfenert. D.ese 
Fnterstreifen wurden mit den Seren von verschiedenen Patienten inkubiert und dann wurden d-e spez. j- 
schen Antikorper durch eine Farbreaktion sichtbar gemacht. Die linke Halfte der F.gur m.t der Uberschnft 
MVP-51 80 zeigt das erfindungsgemaBe Immunschwache-V.rus. Die rechte Halfte der F.gur ze.gt e.n aus 
deutschem Spender isoliertes Virus (MVP-899), bei dem es sich urn ein HIV-1 -Virus handelt. 

Die einzelnen Filterstreifen wurden nun mit den Seren von verschiedenen Patienten inkubiert. Betrachtet 
man die Figur 3, so wurden jeweils dieselben Seren (von deutschen Patienten) umgesetzt m.t je zwe. 
RSerstreifen wobei die Nummern 8 und 26; 9 und 27; 10 und 28; 11 und 29; 12 und 30; 13 und 31; 14 und 
32; 15 und 33 sowie 16 und 34 die gleichen Seren bezeichnen. Bei den Western Blots mit den Nummern 
17 und 18 wurden Seren von afrikanischen Patienten eingesetzt. Die Zahlen an den rechten Seitenrandern 
geben die annShernden Molekulargewichte in Tausend (KD) an. 
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Die Figur 3 zeigt deutlich, daB Seren von deutschen Patienten mit dem erfindungsgemaBen Immun- 
schwache-Virus im Western Blot mit dem gp 41 nur sehr schwach reagieren. Seren von afrikanischen 
Patienten dagegen reagieren mit dem erfindungsgemaBen Immunschwache-Virus sehr stark. Figur 3 macht 
daher deutlich, daB unter Verwendung des erfindungsgemaBen Immunschwache-Virus solche Immunschwa- 
che-lnfektionen nachgewiesen werden konnen, die bei Verwendung eines HIV-1 oder HIV-2-Virus nur 
fragliche, also nicht eindeutig positive Ergebnisse liefern. Diese Nachweismoglichkeit kann weitreichende 
diagnostische Bedeutung haben, da in den Fallen, in denen nur fragliche Ergebnisse im Western Blot erzieft 
werden, nicht mit eindeutiger Sicherheit festgestellt werden kann, ob es sich urn eine Infektion mit einem 
Immunschwache-Virus handelt. Wenn aber mit Hilfe des erfindungsgemaBen Immunschwache-Virus derarti- 
ge fragliche Ergebnisse einer Infektion mit einem Virus des erfindungsgemaBen Typs zugeordnet werden 
konnen, dann stellt dies einen erheblichen diagnostischen Fortschritt dar. 

Beispiel 4 

DNA-lsolierung, Amplifizierung und strukturelle Charakterisierung von Genomabschnitten des HIV-lsolates 
MVP-51 80/91 

Genomische DNA aus MVP-51 80/91 -infizierten HUT 78-Zellen wurden nach Standardmethoden isoliert 
Zur Charakterisierung von Genombereichen des Isolates MVP-51 80/91 wurden PCR (Polymerase Chain 
Reaction)-Experimente mit einem Primerpaar aus dem HOIIproteinbereich gp 41 durchgefuhrt. Die Durch- 
fuhrung der PCR-Experimente erfolgte nach der Methode von Saiki et al. (Saiki et al., Science 239: 487- 
491, 1988) mit folgenden Modifikationen: FUr die Amplifikation HIV-spezifischer DNA-Bereiche wurden 5 ul 
genomische DNA aus MVP-51 80/91 infizierten HUT 78-Zellen in einem 100 ul Reaktionsansatz (0,25 mM 
dNTP, je 1 uM Primer 1 und Primer 2, 10 mM Tris HCI pH 8,3, 50 mM KCI, 1,5 mM MgCI 2 , 0,001 % 
Gelatine, 2,5 units Taq Polymerase (Perkin Elmer) pipettiert und nach folgendem Temperatur-Programm 
amplifiziert: 1. Initiate Denaturierung: 3' 95 °C, 2. Amplifikation: 90" 94 *C, 60" 56 *C, 90 M 72 °C (30 
Cyclen). 

Die fur die PCR und die Nucleotidsequenzierung verwendeten Primer wurden auf dem Oligonucletid- 
synthesizer 8750 der Firma Biosearch synthetisiert (Seq. ID No. 35 + 36). 

Primer 1: AGC AGC AGG AAG CAC TAT GG (Koordinaten aus HIV 1 
Isolat HXB2: Base 7795-7814, entspricht Primer sk 68) 

Primer 2: GAG TTT TCC AGA GCA ACC CC (Koordinaten aus HIV 1 
Isolat HXB2: Base 8003-8022, entspricht Primer env b) . 

Die amplifizierte DNA wurde uber ein 3 % "Nusieve"-Agarosegel (Fa. Biozyme) aufgetrennt, das 
amplifizierte Fragment ausgeschnitten und mit dem gleichen Volumen an Puffer (1xTBE (0,09 M TrisBorat, 
0 t 002 M EDTA pH8,0) versetzt. Nach Inkubation des DNA-Agarosegemisches fur 10 Minuten bei 70 'C und 
nachfolgender Phenolextraktion wurde die DNA aus der wassrigen Phase durch Zugabe von 1/10 Vol 3M 
NaAc pH 5,5 und 2 Vol Ethanol bei -20 *C 15' gefallt und anschlieBend in einer Zentrifuge (Eppendorf) 
pelletiert (13000 rpm, 10\ 4°C). Die pelletierte DNA wurde getrocknet, in Wasser aufgenommen und nach 
der photometrischen Bestimmung der DNA-Konzentration bei 260 nm im Spektralphotometer (Beckman) 
nach der Methode von Sanger (F. Sanger, Proc. Natl.Adac.Sci., 74: 5463, 1977) sequenziert. Anstelle der 
Sequenzierung mit Klenow DNA Polymerase, wurde die Sequenzierungsreaktion mit einem Kit von Applied 
Biosystems ("Taq Dye Deoxy Terminator Cycle Sequencing", Best.-Nr.: 401150) durchgefuhrt. Als Primer 
wurden in getrennten Sequenzierungsreaktionen Primer 1 oder Primer 2 (jeweils 1 uM) eingesetzt. Die 
Analyse der Sequenzierungsreaktion erfolgte auf dem DNA-Sequenziergerat 373A (Applied Biosystems) 
nach den Vorgaben des Gerateherstellers. 

Die Nucleotidsequenz des ampiifizierten DNA-Bereichs und die davon abgeleitete Aminosauresequenz 
ist in der Tabelle 1 dargestellt (Sequ. ID No. 37-39). 
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Tabelle 1; 

GCGCAGCGGCAACAGCGCTGACGGTACGGACCCA^GTGTACT 

CGCGTCGCCGTTGTCGCGACTGCCATG 

AAATALTVRTHSVLKGIVQQ 

10 AGCAGGACAACCTGCTGAGAGCGATACAGGCCCAGCAACACTTGCTGAGGTTATCTGTAT 

+ + + + + + 

TCGTCCTGTTGGACGACTCTCGCTATGTCCGGGTCGTTGTGAACGACTCCAATAGACATA 

QDNLLRAIQAQQHLLRLSVW 

75 

GGGGTATTAGACAACTCCGAGCTCGCCTGCAAGCCTTAGAAACCCTTATACAGAATCAGC 

+ + + + + + 

CCCCATAATCTGTTGAGGCTCGAGCGGACGTTCGGAATCTTTGGGAATATGTCTTAGTCG 

20 GIRQ LRARLQALETLIQ NQQ 

AACGCCTAAACCTAT 

+ 195 

TTGCGGATTTGGATA 

25 

R L N L 



30 Beispiel 5 

Die gefundene Nucleotidsequenz aus Tabelle 1 wurde auf homologe Sequenzen in der GENEBANK- 
Datenbank (Release 72, Juni 1992) mit Hilfe des GCG-Computerprogramms (Genetic Computer Group, Inc., 
Wisconsin USA, Version 7.1, Marz 1992) untersucht. In dieser Datenbank sind die meisten der bis Juli 1992 
35 bekannten Nucleotidsequenzen von Immundefizienzviren humanen Ursprungs und von Isolaten aus Prima- 
ten enthalten. 

Die Nucleotidsequenz aus Tabelle 1 weist im besten Fall eine 66 %ige Homologie zu einem 
Schimpansen-lsolat auf. Zu HIV 1 -Isolaten ist MVP 5180/91 in der untersuchten DNA-Sequenz im besten 
Fall zu 64 % homolog. Zu HIV 2-lsolaten ist die DNA aus Tabelle 1 zu 56 % homolog. AuBer der Sequenz 
40 des Schimpansenisolates besteht die beste Homologie zwischen der Nucleotidsequenz aus Tabelle 1 und 
DNA-Abschnitten aus Primatenisolaten (SIV: Simian Immunodeficiency Virus) in einer DNA-Sequenz, die fur 
einen Teilbereich des Hullproteins des Isolates SIV (Afrikanische Meerkatze) TYO-1 kodiert. Die Homologie 
betragt 61,5 %. 

45 Beispiel 6 

Die gefundene Aminosauresequenz aus Tabelle 1 wurde auf homologe Sequenzen in der SWISSPROT 
Protein-Datenbank (Release 22, Juni 1992) mit Hilfe des GCG-Computerprogramms untersucht. In dieser 
Datenbank sind die meisten der bis Juni 1992 bekannten Proteinsequenzen von Immundefizienz-Viren 

so humanen Ursprungs und von Isolaten aus Primaten enthalten. 

Die Aminosauresequenz aus Tabelle 1 ist im besten Fall mit 62,5 % zu einem Hullproteinabschnitt des 
oben genannten Schimpansenisolates homolog. Unter HIV 1-HUIIproteinen findet man die beste Homologie 
mit der Aminosauresequenz aus Tabelle 1, in dem Isolat HIV 1 Mai. Die Homologie betragt 59 %. Zu HIV 2- 
HUllproteinen betragt die Homologie mit der Aminosauresequenz aus Tabelle 1 im besten Fall 52 % (Isolat 

55 HIV 2 Rod). Da auch HIV 1 und HIV 2-lsolate im besten Fall im korrespondierenden Proteinabschnitt nur zu 
64 % identisch sind, scheint es sich bei dem Isolat MVP-51 80/91 urn eine HIV-Variante zu handeln, die sich 
deutlich von HIV 1 und von HIV 2 strukturell abgrenzt und somit einen Vertreter einer davon unabhangigen 
Gruppe von HIV-Viren repr&sentiert. 
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Die Aminosauresequenz des amplifizierten DNA-Bereiches (Tabelle 1) des HIV-lsolates MVP 5180/91 
Gberlappt mit einem immundiagnostisch wichtigen Bereich aus dem Hullprotein gp 41 von HIV 1 (Amino- 
saure 584-618*) (Tabelle 2) (Gnann et al., J. Inf. Dis. 156: 261-267, 1987; Norrby et al., Nature. 329: 248- 
250, 1987). 

5 Korrespondierende Aminosaurebereiche aus den Hullproteinen von HIV 2 und SIV sind ebenfalls 

immundiagnostisch konserviert (Gnann et al., Science, S. 1346-1349, 1987). So werden Peptide aus diesem 
HUllproteinbereich von HIV 1 und HIV 2 in vielen kommerziell erhaltlichen HIV 1/2 Antikorper-Screeningtests 
als Festphasenantigene eingesetzt. Ungefahr 99 % der anti HIV 1 und anti HIV 2 positiven Seren konnen 
dam it erfaBt werden. 

w Der Aminosaurebereich des MVP-51 80/91 -HUllproteins (Tabelle 1) konnte aufgrund der Uberlappung 
mit dem immundiagnostisch wichtigen Bereich aus gp 41 serodiagnostisch von Bedeutung sein. Dies ware 
insbesondere dann der Fall, wenn Antiseren von HIV-infizierten Patienten mit keinem der kommerziell 
erhaltlichen Antikorper-Screeningtests positiv reagieren wurden. In diesen Fallen konnte eine Infektion mit 
einem MVP-51 80/91 eng verwandten Virus vorliegen. 

75 

Tabelle 2: 

• # * • 
RILAVERYLKDQQLLGIWGCSGKLICTTAVPWNAS 

20 I : I : I • : • : I I I • : 

WG I RQLRARLQALET L I QNQQRLNL 



25 Beisplel 7 

DNA Isolierung, Amplifizierung und strukturelle Charakterisierung von Genomabschnitten des HIV Isolates 
MVP-51 80/91 (kodierend fUr gp 41) 

Genomische DNA aus MVP-51 80/91 -infizierten HUT78-Zellen wurden wie beschrieben isoiiert. 
Zur Charakterisierung von Genombereichen des Isolates MVP-51 80/91 wurden PCR (Polymerase Chain 
Reaction)-Experimente mit Primerpaaren aus dem HUllproteinbereich gp 41 durchgefiihrt. Die PCR (Saiki et 
aL, Science 239: 487-491, 1988) und inverse PCR (Triglia et al., Nucl. Asids, Res. 16: 8186, 1988) wurden 
mit folgenden Modifikationen durchgefUhrt: 

1. PCR 

Fur die Amplifikation HIV-spezifischer DNA Bereiche wurden 5 ul (218 ug/ml) genomische DNA aus 
MVP-51 80/91 infizierten HUT78 Zellen in einem 100 ul Reaktionsansatz (0,25 mM dNTP, je 1 uM Primer 
40 163env und Primer envend, 10 mM Tris HCI pH 8.3, 50 mM KCI, 1.5 mM MgCfe, 0,001 % Gelatine, 2,5 
units Taq Polymerase (Perkin Elmer)) pipettiert und nach folgendem Temperaturprogramm amplifiziert: 1. 
Initiale Denaturierung: 3 min. 95 *C, 2. Amplifikation: 90 sec. 94 °C, 60 sec. 56 *C, 90 sec. 72 *C (30 
Cyclen). 

45 2. Inverse PCR 

Der 5' Bereich von gp 41 (N-Terminus) und die 3* Sequenz von gp 120 wurden mittels "inverser PCR" 
amplifiziert. Hierzu wurden 100 ul einer genomischen DNA Preparation (218 ug/ml) aus MVP-51 80/91- 
infizierten HUT78-Zellen in einem Endvolumen von 200 ul mit 10 units der Restriktionsendonuklease Sau3a 

50 1 Stunde bei 37 *C verdaut. Die DNA wurde anschlieBend phenolisiert und mit Natriumazetat (Endkonzen- 
tration 300 mM) und 2.5 Volumen Ethanol 10 min bei -70^ gefallt, in der Eppendorfzentrifuge abzentrifu- 
giert und das Pellet getrocknet und in 890 ul Aqua dest. resuspendiert. Nach Zugabe von 100 ul 
Ligasepuffer (50 mM Tris HCI, pH 7,8, 10 mM MgCI 2 , 10 mM DTT, 1 mM ATP, 25 ug/ml Rinderserumalbu- 
min) und 10 ul T4 DNA-Ligase (Fa. Boehringer, Mannheim) wurden die DNA-Fragmente 3 Stunden bei 

55 Raumtemperatur ligiert, erneut phenolisiert und mit Natriumazetat und Ethanol wie oben gefallt. Nach dem 
Abzentrifugieren und Trocknen wurde die DNA in 40 ul Aqua dest. resuspendiert und mit 10 units der 
Restriktionsendonuklease Sacl (Fa. Boehringer, Mannheim) fOr 1 Stunde verdaut. AnschlieBend wurden 5 ul 
dieses Ansatzes in einem PCR-Experiment wie unter "1. PCR" dargestellt, eingesetzt. Anstelle der Primer 

11 

BNSDOCtD: <EP 0591914A2_I_> 



EP 0 591 914 A2 



163env und envend wurden fUr die inverse PCR die Primer 168i und 169i verwendet. 

Die Primer 163env, 168i und 169i wurden aus der bereits ermittelten Teilsequenz des HIV-lsolates 
MVP-5180 ausgewahlt (Beispiei 4). 

Die fUr die PCR/inverse PCR und die Nucleotidsequenzierung verwendeten Primer wurden auf dem 
s Oligonucleotidsynthesizer 8750 der Firma Biosearch synthetisiert, wobei die Primer folgende Sequenzen 
aufwiesen (Sequ. ID No. 40-43): 



Primer 163env: 5' CAG AAT CAG CAA CGC CTA AAC C 3' 

"> Primer envend: 5* GCC CTG TCT TAT TCT TCT AGG 3' 

(Position aus HIV 1 Isolat BH10: 
Base 8129-8109) 

Primer 168i: 5' GCC TGC AAG CCT TAG AAA CC 3' 

« Primer 169i: 5' GCA CTA TAC CCT TCA GTA CAC TG 3* 



Die amplifizierte DNA wurde uber ein 3 % "Nusieve"-Agarosegel (Fa. Biozyme) aufgetrennt, das amplifizier- 
te Fragment ausgeschnitten und mit dem gleichen Volumen an Puffer (1xTBE (0.09 M TrisBorat, 0.002 M 

20 EDTA, pH 8.0)) versetzt. Nach Inkubation des DNA-Agarosegemisches fGr 10 Minuten bei 70 °C und 
nachfolgender Phenolextraktion wurde die DNA aus der wassrigen Phase durch Zugabe von 1/10 Vol 3M 
NaAc, pH 5,5 und 2 Vol Ethanol bei -20 *C 15' gefallt und anschlieBend in einer Eppendorfzentrifuge 
pelletiert (13000rpm, 10', 4*C). Die pelletierte DNA wurde getrocknet, in Wasser aufgenommen und nach 
der photometrischen Bestimmung der DNA-Konzentration bei 260nm im Spektralphotometer (Fa. Beckman) 

25 nach der Methode von Sanger (F. Sanger, Proc. Natl. Acad. ScL, 74:5463, 1977) sequenziert. Anstelle der 
Sequenzierung mit Klenow DNA Polymerase wurde die Sequenzierungsreaktion mit einem Kit der Fa. 
Applied Biosystems ("Taq Dye Deoxy Terminator Cycle Sequencing", Best. Nr.: 401150) durchgefuhrt. Als 
Primer wurden in getrennten Sequenzierungsreaktionen Primer 163env Oder Primer envend (jeweils mM) 
eingesetzt. Die amplifizierte DNA aus dem inversen PCR-Experiment wurde mit den Primern 168i und 169i 

30 sequenziert. Die Analyse der Sequenzierungsreaktion erfolgte auf dem DNA-Sequenziergerat 373A (Applied 
Biosystems) nach den Vorgaben des Gerateherstellers. 

Die Nucleotidsequenz des amplifizierten DNA-Bereichs und die davon abgeleitete Aminosauresequenz 
sind in der Tabelle 3 dargestellt (Sequ. ID No. 44-46). 

35 
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Tabelle 3 

AAATGTCAAGACCAATAATAAACATTCACACCCCTCACAGGGAAAAAAGAGCAGTAGGAT 
s 1 + + + + + + 6Q 

TTTACAGTTCTGGTTATTATTTGTAAGTGTGGGGAGTGTCCCTTtPTTTCTCGTCATCCTA 

MSRPI I N I HT PHREKRfAVGL 

gpl204- -J > gp41 

10 TGGGAATGCTATTCTTGGGGGTGCTAAGTGCAGCAGGTAGCACTATGGGCGCAGCGGCAA 

61 + + + + + + 120 

ACCCTTACGATAAGAACCCCCACGATTCACGTCGTCCATCGTGATACCCGCGTCGCCGTT 

GMLFLGVLS AAGS TMGAAAT 

'5 CAGCGCTGACGGTACGGACCCACAGTGTACTGAAGGGTATAGTGCAACAGCAGGACAACC 

121 + + + + + + 180 

GTCGCGACTGCCATGCCTGGGTGTCACATGACTTCCCATATCACGTTGTCGTCCTGTTGG 

ALTVRTHSVLKGI VQQQDNL 

20 TGCTGAGAGCGATACAGGCCCAGCAACACTTGCTGAGGTTATCTGTATGGGGTATTAGAC 

18 1 + + + + + + 240 

ACGACTCTCGCTATGTCCGGGTCGTTGTGAACGACTCCAATAGACATACCCCATAATCTG 
LRA I QAQQ HLLRL SVWG IR Q 

25 AACTCCGAGCTCGCCTGCAAGCCTTAGAAACCCTTATACAGAATCAGCAACGCCTAAACC 

241 + + + + + + 300 

TTGAGGCTCGAGCGGACGTTCGGAATCTTTGGGAATATGTCTTAGTCGTTGCGGATTTGG 
LRARL QALETLIQNQQRLNL 

30 

TATGGGGCTGTAAAGGAAAACTAATCTGTTACACATCAGTAAAATGGAACACATCATGGT 
301 + + + + + + 36C 

ATACCCCGACATTTCCTTTTGATTAGACAATGTGTAGTCATTTTACCTTGTGTAGTACCA 
WGCKGKL I CYTSVKW NTSWS 

35 

CAGGAGGATATAATGATGACAGTATTTGGGACAACCTTACATGGCAGCAATGGGACCAAC 

3 6 1 + + + + + + 4 20 

GTCCTCCTATATTACTACTGTCATAAACCCTGTTGGAATGTACCGTCGTTACCCTGGTTG 

GGYNDDS I WDNLTWQQWDQH 

40 

, , , ACATAAACAATGTAAGCTCCATTATATATGATGAAATACAAGCAGCACAAGACCAACAGG 

4zl + + + + + + 480 

TGTATTTGTTACATTCGAGGTAATATATACTACTTTATGTTCGTCGTGTTCTGGTTGTCC 
INNVSSI I YDEIQAAQDQQE 

45 

50 
55 
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AAAAGAATGTAAAAGCATTGTTGGAGCTAGAM 54Q 
" 1 ^TTCTTA^TTTTCGT^ 



KNV KALLEL 



DEWASLWNWFD 



70 



ACATAACTAAATGGTTGTGGTA^^ 6 Q Q 

541 iCTAOT«TTTACCAJ^ 



I TKWLWYIKIAI IIVGALIG 

rT A ATHTAGTGAAGAACATTAGGCAGGGATATCAAC 



75 



20 



25 



GTATAAGAGTTATCATGATAGTACTTAATCTAGTG^G^^TTAGG^^^TATC^C ^ 

6 ° 1 CATATTCTCAATAGTACTATCATGAATO 
IRVIMIVLNLVKNIRQGYQP 

CCCTCTCCTTGCAGMCCCTG^ ? 2 Q 

561 GGGAGAGCAACGTCTAGGGACAG^ 

LSLQIPVPHRQEAETPGRTG 

GAGAAGAAGGTGGAGAAGGAGACAGGCCC^GTGGACAG^^ ?8o 

7 2 1 CTCTTCTTCCACCTCTTCCTCTGTCCGGGTTCACCTGTCGGAACG^ 
EEGGEGDRPKWTALPPGFLQ 

AACAGTTGTACACGGATCTCAGGACAATAATCTTGTGGACT ^ 
78 1 ^GT^^i^GCCTAGAGTCCTG^TA^AGAACACCTGAATGGTGGAGAACTCGTTGA 
QLYTDLRTIILWTYHLLSNL 
841 TAATATCAGGGATCCGGAGGCTGATCGACTACCTGGGACTGG^ 90 0 
35 ATTATAGTCCCTAGGCCTCCGACTAGCTGA 

ISGIRRLIDYLGLGLWILGQ 
AAAAGACAATTGAAGCTTGTAGACTTTGTGGAGCTGTAATGCAATA g g Q 

9 ° 1 TTTTCTGTTAACTTCGAACATCTGAAACA^ 

KTIEACRLCGAVMQYWLQEL 

TGAAAAATAGTGCTACAAACCTGCTTGATACTATTGCAGT ^ ^ 

9 6 1 ACTTTTTATCACGATGTTTGGACGAACTATGATAACGTCACA 



30 



40 



46 



KNSATNLLD 



TIAVSVANWTD 



50 



ACGGCATCATCTTAGGTCTACAAAGAATAGGACAAGG 

-I 021 + + + 1057 

TGCCGTAGTAGAATCCAGATGTTTCTTATCCTGTTCC 

55 GIILGLQRIGQ 
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Belsptel 8 



Die gefundene Nucleotidsequenz aus Tabelle 3 wurde auf homologe Sequenzen in der GENEBANK- 
Datenbank (Release 72, Juni 1992) mit Hilfe des GCG-Computerprogramms (Genetic Computer Group. Inc 
Wisconsin USA, Version 7.1, Marz 1992) untersucht. In dieser Datenbank sind die meisten der bis Juii 1992 
bekannten Nucleotidsequenzen von Immundefizienzviren humanen Ursprungs und von Isolaten aus Prima- 
ten enthalten. 

Die Nucleotidsequenz aus Tabelle 3 weist im besten Fall eine 62 %ige Homologie zu einem HIV 1- 
Isolat auf. Zu HIV 2 Isolaten ist die DNA aus Tabelle 5 zu 50 % homolog. 

Die aus der Nucleotidsequenz aus Tabelle 3 abgeleitete Aminosauresequenz wurde auf homologe 
Sequenzen in der SWISSPROT Protein- Datenbank (Release 22, Juni 1992) mit Hilfe des GCG-Computer- 
programms untersucht. In dieser Datenbank sind die meisten der bis Juni 1992 bekannten Proteinsequen- 
zen von Immundefizienzviren humanen Ursprungs und von Isolaten aus Primaten enthalten 

Die Aminosauresequenz aus Tabelle 3 ist im besten Fall mit 54 % zu dem korrespondierenden 
Hullprotemabschnitt eines Schimpansen-lsolates CIV (SIVcpz) homolog und zu 54,5 % zu dem HIV 1-lsolat 
Mai. Zu HIV 2-HUIIproteinen betragt die Homologie mit der Aminosauresequenz aus Tabelle 3 im besten 
Fall 34 % (Isolat HIV 2 D194). 

Vergleicht man demgegenuber die gp 41 -Aminosauresequenz von HIV 1 mit den in der SWISSPROT- 
Datenbank vorhandenen HIV 1 gp 41-Sequenz, ergeben sich wie erwartet im besten Fall eine fast 100 %ige 
Homologie und im schlechtesten Fall eine 78 %ige Homologie. 

Aufgrund dieser deutlichen strukturellen Unterschiede zwischen dem Sequenzbereich aus Tabelle 3 und 
dem korrespondierenden Abschnitt aus HIV 1 und HIV 2 scheint es sich bei dem Isolat MVP-51 80/91 urn 
eine HIV-Variante zu handeln, die sich von HIV 1 und HIV 2 deutlich strukturell abgrenzt. Moglicherweise ist 
MVP-51 80/91 einer eigenen, von HIV 1 und HIV 2 sich abgrenzenden Gruppe von HIV-Viren zuzuordnen 

Das Peptid von Aminosaure 584-618 des HIV 1-HUIIproteinbereichs ist von besonderem serodiagnosti- 
schem Interesse (Numerierung nach Wain Hobson et al., Cell 40:9-17, 1985; Gnann et al J Inf Dis 
156:261-267, 1987; Norrby et al., Nature, 329:248-250, 1987). Korrespondierende Aminosaurebererche aus 
den Hullproteinen von HIV 2 und SIV sind ebenfalls immundiagnostisch konserviert (Gnann et al., Science 
S. 1346-1349, 1987). So werden Peptide aus diesem Hullproteinbereich von HIV 1 und HIV 2 in vielen 
kommerziell erhaltlichen HIV 1/2 Antikorper-Screeningtests als Festphasenantigene eingesetzt. Ungefahr 99 
% der Anti-HIV 1 und Anti-HIV 2 positiven Seren konnen damit erfaBt werden. 

Der korrespondierende Aminosaurebereich des MVP-51 80/91 -Htillproteins (Tabelle 4) als auch das 
gesamte gp 41 dieses Isolates konnten serodiagnostisch insbesondere dann von Bedeutung sein wenn 
Antiseren von HIV-infizierten Patienten in kommerziell erhaltlichen Antikorper-Screening-Tests nur schwach 
Oder uberhaupt nicht reagieren wurden. In diesen Fallen konnte eine Infektion mit einem MVP-51 80/91 enq 
verwandten Virus vorliegen. 



Tab. 4: 



R I LA VER YLKDQQLLG I WGCSGKL I CTTA VPWNA S 
LQ L TLIQN R NL K Y S K T 



HIV 1 Aminosauresequenz aus gp41 

MvP5180-Sequenz aus gp41. Nur Unterschiede zu der HIV 1- 
Sequenz sind ausgedruckt. 



Das Peptid, das mit Hilfe der von MvP 5180 stammenden Information aufgefunden wurde, hat also die 
Aminosauresequenz: RLQALETLIQNQQRLNLWGCKGKLICYTSVKWNTS. 

Gegenstand der vorliegenden Erfindung sind daher Peptide, die rekombinant Oder synthetisch herge- 
stellt werden konnen und die oben angegebene Sequenz Oder Teilsequenz aufweisen, wobei die Teilse- 
quenzen wenigstens 6 aufeinanderfolgende Aminosauren, bevorzugt 9 und besonders bevorzugt 12 aufein- 
anderfolgende Aminosauren aufweisen. 
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Beispiel 9 

Klonierung des Gesamtgenoms des HIV-lsolates MvP5180 
5 a) Herstellung einer genomischen Bibliothek 

Genomische DNA aus MvP5180-infizierten HUT78-Zellen wurde wie beschrieben isoliert. 
300 ug dieser DNA wurde in einem Volumen von 770 ul mit 0,24 U des Restriktionsenzyms Sau3A fOr 45 
min inkubiert Die dadurch nur partiell geschnittene DNA wurde anschlieBend Qber ein 0,7 %.ges Agarose- 
w gel (low melting agarose, Nusieve) grSBenfraktioniert und Fragmente zwischen 10 und 21 kb ausgeschnit- 
ten Die Agarose wurde fUr 10 min bei 70 'C geschmolzen und mit demselben Volumen Puffer (1 x TBE, 
0 2 M NaCI) versetzt. AnschlieBend folgte nach zweimaliger Phenol- und einmaliger Chloroformextraktion 
die Fallung der DNA durch Zugabe von 1/10 Vol 3 M Natriumacetatlosung (pH 5,9) und 2,5 Vol Ethanol be. 
-70 "C fur 10 min. Die gefallte DNA wurde abzentrifugiert, getrocknet und in einer Konzentration von 1 ug/ui 

15 SrAusbeute^an groBenfraktionierter DNA betrug etwa 60 ug. 5 ug dieser DNA wurden mit 1 U Alkalische 
Phosphatase im entsprechenden Puffer fur 20 min bei 37 -C inkubiert. Durch Abspaltung des 5 -term.nalen 
Phosphatrestes wurden so multiple Insertionen von groBenfraktionierter DNA vermindert. D.e Phosphatase- 
behandlung wurde durch Phenolisierung gestoppt, die DNA wie oben gefallt und zusammen m.t 1 ug des 

20 Vektors (2 DASH, BamHI geschnitten, Stratagene Nr.: 247611) in 6 ul Gesamtvolumen mrt 2 We.ss-Un.ts 
Umbda T4 Ligase fUr 12 Stunden bei 15 'C ligiert. Nach erfolgter Ligation wurde die DNA mit Hilfe eines 
Verpackungskits (Gigapack II Gold, Stratagene Nr.: 247611) genau nach Angaben des Herstellers in 
PhagenhUllen verpackt. 

25 b) Radioaktive Markierung der DNA-Probe 

Fur die Markierung wurde der "Random Primed DNA Labeling Kit" von Boehringer Mannheim (Nr.: 713 
023) eingesetzt. Markiert wurde das PCR-Produkt, welches wie in Beispiel 3 beschrieben mrt den Pnmern 
sk68 und envb erhalten wurde. 1 ug dieser DNA wurde durch 2 x 5 min KoctM und ^heBender 
30 Abkuhlung in Eiswasser denaturiert. Zur Markierung wurden 50 mC. [a- 32 P]-dCTP (NEN Nr.. NEX-053H) 
zugegeben. Sonstige Zusatze wurden nach Herstellerangaben pipettiert. Nach einer Inkubation von 30 mm 
bei 37 "C erfolgte eine Fallung der nun radioaktiv markierten DNA. 

c) Screening der Phagen-Bibliothek 

35 Zu 200 ul einer bei 30 -C uber Nacht angezogenen Kultur (Stamm SRB(P2) [Stratagene, Nr.: 247611] 
in LB-Medium. welches 10 mM MgSO*. sowie 0,2 % Maltose enthielt) wurden 20000 pfu (Plaque form.ng 
units) der Bibliothek in 100 ul SM-Puffer (5,8 g NaCI, 2 g MgSO* 50 ml 1 M Tris. pH 7,5 und 5 ml emer 2 
% Gelatinelbsung in 1 I H 2 0 gelost) gegeben, die Phagen 20 min bei 37 -C an die Bakter.en adsorb.ert m.t 

40 7 5 ml auf 55-C abgekOhlter Top-Agarose gemischt und auf einer vorgewSrmten Lb-Agarplatte von 14 cm 
Durchmesser verteilt. Nach etwa 8 Stunden erreichten die Plaques Konfluenz. Daraufhin wurden Nit'ocellu- 
losefilter fUr wenige Minuten auf die Platten gelegt und asymmetrische Markierungen angebracht. Nach 
vorsichtigem Abheben wurden die Filter fOr 2 min denaturiert (0,5 M NaOH 1,5 M NaCI) ^unc Idanr ,5 m.n 
neutralisiert (0.5 M Tris, pH 8, 1,5 M NaCI). Nach anschlieBendem Backen der Filter be! 80 C fur 60 mm, 

45 konnten die Filter mit der Probe hybridisiert werden. 

Zur Vorhybridisierung wurden die Filter in 15 ml Hybridisierungslosung (50 % Formam.d, 0.5 A S°S 5 x 
SSPE, 5 x Denhardfs Losung und 0,1 mg/ml Lachssperma-DNA) pro Filter bei 42 -C unter Schutteln 2-3 h 
inkubiert. Die pp]-markierten DNA-Proben wurden 2-5 min bei 100 -C denaturiert. auf Eis abgekuhlt der 
VorhybridisierungslSsung zugesetzt und 12 Stunden bei 42 «C hybridisiert. AnschlieBend wurden d.e Filter 

so bei 60- C zunachst mit 2 x SSC/0,1 % SDS, dann mit 0.2 x SSC/0,1 % SDS gewaschen. JMach Trocknen 
der Filter wurden Hybridisierungssignale mit Hilfe des RSntgenfilms X-OMAT™ AR (Kodak) detekt.ert. 
Die Plaques, denen ein Signal zugeordnet werden konnte. wurden nach Elution in SM-Puffer m werteren 
VerdUnnungsschritten vereinzelt. j 
Der unten beschriebene Klon konnte nach dem Screening von 2 x 10 s Plaques identifiz.ert werden. 

55 
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10 



is 



20 



25 



d) Isolierung der Phagen-DNA und Subklonierung 

Mit 10 ul eines Phageneluats in SM-Puffer, wurde eine Obernachtkultur des Wirtsstammes SRB (P2) so 
mfiziert. daB nach zunachst dichtem Wachstum der Kultur nach etwa 6-8 h Lyse erfolgte. Von der lysierten 
Kultur warden Zellreste durch zweimalige Zentrifugation bei 9000 g fur 10 min abgetrennt. AnschlieBend 
wurden d.e Phagen durch Zentrifugation pelletiert (35000 g, I h), in 700 ul 10 mM MgSO, aufgenommen 
und solange phenolisiert, bis keine Proteininterphase mehr zu sehen war. Daraufhin wurde die Phagen-DNA 
gefallt m.t dem Restriktionsenzym EcoRI geschnitten und die daraus erhaltenen EcoRI-Fragmente in den 
Vektor Bluescript KS" (Strategene. Nr.: 212208) subkloniert. Insgesamt wurden 4 Klone erhalten- 



Plasmid 


Beginn 1 


Ende 1 


pSP1 


1 


1785 


pSP2 


1786 


5833 


pSP3 


5834 


7415 


pSP4 


7660 


9793 



'bzgl. der folgenden G esamtsequenz 

t A t D ^ fe h |e "ae StOck zwischen Base 7416 und 7659 wurde durch PCR mit den Primem 157 (CCA TAA 
TAT TCA GCA GAA CTA G) und 226 (GCT GAT TCT GTA TAA GGG) erhalten. Als DNA-Template wurde 
die Phagen-DNA des Klons verwendet. Die Bedingungen fur die PCR waren: 1.) Initiate Denaturierung- 
94 • C, 3 mm, 2.) Amplifikation: 1 ,5 min 94 • C, 1 min 56 • C und 1 min 72 • C fOr 30 Zyklen 
Die Sequenzierung der DNA erfolgte wie in Beispiel 4 beschrieben. Vom gesamten Genom wurde sowohl 
der Strang- als auch der Gegenstrang sequenziert. Bei alien EcoRI Schnittstellen wurde durch PCR mit 
Phagen-DNA des Klons als DNA-Template verifiziert, daB es sich an den SubklonObergangen jeweils urn 
singulare EcoRI-Schnittstellen handelt. 



Tab. 5 



30 



35 



Die Lage der Gene der Virusprotelne GAG, POL und ENV in der Gesamtsequenz von MvP5180 


Gen 


Start 1 


Stop 1 


GAG 


817 


2310 


POL 


2073 


5153 


ENV 


6260 


8887 



40 



45 



50 



55 



1.) Die Zahlen geben die Basenpositionen in der Gesamtsequenz von MvP51 80/91 



Die Gesamtsequenz von MvP51 80/91 ist in Fig, 4 dargestellt 
Beispiel 10 

Abgrenzung der Gesamtsequenz von MvP51 80/91 von anderen HIV1-lsolaten 

Grundlage fur die folgenden Sequenzvergleiche war die Datenbanken Genbank Release 75 von 2 93 
EMBL 33 von 12.92 und Swissprot 24 von 1.93. Homoiogievergleiche erfolgten mit der GCG-Software 
(Version 7.2, 10.92. der Genetics-Computer-Group, Wisconsin). 

Zunachst wurden auf Aminosaureebene die Sequenzen von GAG, POL und ENV mit dem Programm 
Wordsearch" mit der Datenbank verglichen. Die 50 besten Homologen wurden mit dem Programm 
Pileup jeweils unteremander verglichen. Daraus geht deutlich hervor, daB MvP51 80/91 in den HIV1- 
Stammbaum fallt, dort aber sehr fruh, sogar noch vor dem Schimpansenvirus SIVcpz abzweigt, also eine 
neue Subfamilie von HIV1 reprasentiert. Urn Zahlenwerte fur die Homologien zu erhalten, wurde mit dem 
Programm Gap" MvP5180 mit den jeweils am besten passenden HIV1, HIV2 und SIV-Sequenzen und 
zusatzhch mit der SIVcpz-Sequenz verglichen. 
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Tab. 6 



Homoioqiewerte der Amfnosauresequenz von GAG, POL und ENV des M 


vP51 80/91-1 


solates 


GAG 


SIVcpz 


70,2% 
83,6% 


HIV1u 2 


69,9% 
81 ,2% 


HIV2d 3 


53,6% 
71 ,3% 


SIV1a 4 


55,1% 
71 ,3% 


POL 


SIVcpz 


78,0% 
88,0% 


HIV1u 2 


76,1% 
86,8% 


HIV2d 3 


57,2% 
71,9% 


SIVgb 5 


57,7% 
74,6% 


ENV 


SIVcpz 


53,4% 
67,1% 


HIV1h 1 


50,9% 
67,2% 


HIV2d 3 


34,4% 
58,7% 


SIVat 5 


34,4% 
57,8% 



10 



15 



20 



25 



30 



1 h = hz321 /Zaire, 
2 u = u455/Uganda, 
3 d=jrcst, 
4 a = agm155, 
5 gb = gbl 
6 at = agm 



Der obere Zahlenwert drUckt die Identitat, der untere die Ahnlichkeit beider Sequenzen aus. 
Weiter wurde die Datenbank mit "Wordsearch" und "Gap" auf Nukleotidebene durchsucht. Die Homolog.e- 
werte fur die jeweils besten "matches" sind in Tabelle 7 zusammengefaBt. 



Tab. 7 



Homologiewerte der Nukleotidsequenz von MvP51 80/91 




HIV1 




HIV2 




gag 


HIVelicg 


70,24 % 


HIV2bihz 


60,0 % 


pol 


HIVmal 


75,0 % 


HIV2cam2 


62,9 % 


env 


HiVsimi84 


59,7 % 


HIV2gha 


49,8 % 



35 

Beispiel 11 

Beschreibung der PCR Amplifizierung, Klonierung und Sequenzierung des gag Gens des HIV 5180 Isolates 

40 Urn die im Laufe der Virusvermehrung auftretenden Spontanmutationen darzustellen. wurde ein Tail des 
Virusgenoms mit der PCR-Technik kloniert und die so erhaltene DNS-Sequenz verglichen m.t der Sequenz 

^Te^Sequenz wurde vom LTR ("long terminal repeat", LTR1 primer) des linken Endes des MvP 
5180 Genomes bis in das pol (Polymerase Gen, pol3.5i primer) hinein Qberlappend klon.ert. D ie Klon.e- 
46 rungsstrategie ist in Fig. 5 schematisch dargestellt. k^^us- 
Die PCR Reaktionen wurden mit den u.g. DNA Primern, deren Sequenzen von der HIV-1 Konsensus 
Sequenz abgeleitet wurden, durchgefuhrt. Die Sequenzierungen erfolgten m.t H.lfe der D,deoxykettenab- 

Di^f^daf^vP 5180 gag Gen kodierende Sequenz erstreckt sich von Nukleotid 817 (A des ATG 
so Startkodons) bis Nukleotid 2300 (A des letzten Kodons) (Sequ. ID No. 47-53). 



55 
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LTR1: 


5 f 


- CTA 


gag3 . 5 : 


5' 


- AAT 


gag 3.5i: 


5 f 


- TCC 


gag5 : 


5' 


- CCA 


gag959 : 


5' 


- CGT 


gaglli : 


5* 


- TCC 


pol3.5i: 


5' 


- AAA 



GCA GTG GCG CCC GAA 
GAG GAA GCU GCA GAU 
CAU TCT GCU GCT TCC 
AGG GGA AGT GAC ATA 
TGT TCA GAA TTC AAA 
CTA AAA AAT TAG CCT 
CCT CCA ATT CCC CCT 



CAG G -3' 

TGG GA -3' (U=A/T) 
TCA TT -3' (U=A/T) 
GCA GGA AC -3' 
CCC -3 * 
GTC -3* 
A -3' 



15 



20 



Die bei der PCR-Technik erhaltene DNS-Sequenz wurde der in Figur 4 dargestellten DNS-Sequenz 
gegeniibergestellt. Ein Vergleich der beiden DNS-Sequenzen ist in Figur 6 dargestellt. Hierbei wurde 
festgestellt, daB sich die Nukleotide in ca. 2 % voneinander unterscheiden, obwohl es sich um dasselbe 
Virus handelt. In Fig. 6 stellt jeweils die obere Zeile die DNS-Sequenz dar, die in Fig. 4 dargestellt ist und 
die untere Zeile stellt die mit PCR-Technik erhaltene DNS-Sequenz dar. 

Weiterhin wurde die Aminosauresequenz des mit PCR-Technik ermittelten Proteins gag der Aminosau- 
resequenz des aus Fig. 4 abgeleiteten entsprechenden Proteins gegenCibergestellt. Dabei wurde ein 
Unterschied der Aminosaure von ca. 2,2 % ermittelt. Der Vergleich ist in Fig. 7 dargestellt, wobei die untere 
Zeile jeweils die Aminosauresequenz darstellt, die von der mit PCR-Technik erhaltenen Sequenz abgeleitet 
wurde. 

Belsplel 12 



Es wurde die Sequenz des erfindungsgemafien Virus MvP 5180 verglichen mit den Konsensus- 
Sequenzen von HIV1 und HIV2 und soweit bekannt mit der Sequenz von ANT-70 (WO 89/12094). 
25 Dabei wurden folgende Ergebnisse erhalten: 

Tab. 8 



50 



55 



30 


Genort 


abweichende Nukleotide 


Zahl der Nukleotide 


% Homologie (genahert) 




LTR 


207 
308 
115 


630 


HIV-1 67 % 
HIV-2 51 % 
ANT 70 82 % 


35 


GAG 


448 
570 


1501 


HIV-1 70 % 
HIV-2 62 % 




POL 


763 
1011 


3010 


HIV-1 74 % 
HIV-2 66 % 


40 


VIF 


183 
338 


578 


HIV-1 68 % 
HIV-2 42 % 




ENV 


1196 
1289 


2534 


HIV-1 53 % 
HIV-2 49 % 


45 


NEF 


285 
342 


621 


HIV-1 54 % 
HIV-2 45 % 




total 


3082 
3858 


8874 


HIV-1 65 % 
HIV-2 56 % 



In der obigen Tabelle bedeuten "HIV-1" Konsensus-Sequenzen von HIV-1 Vlren; "HIV-2" Konsensus- 
Sequenzen von HIV-2 Viren; ANT-70 aus der WO 89/12094 bekannte Teilsequenz eines als HIV-3 
bezeichneten Virus. 

Gegenstand der vorliegenden Erfindung sind daher Viren, DNS-Sequenzen, Aminosauresequenzen 
sowie Teilsequenzen davon, die eine solche Homologie mit der in Fig. 4 dargestellten Sequenz aufweisen, 
bezogen auf die Genorte, daB hochstens die in Tabelle 9 angegebenen Anteile, ausgedrOckt in %-Werten 
unterschiedlich sind. 
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Tab. 9 



10 



75 



20 



25 



30 



35 



Homologle bezogen auf Genorte, ausgedrUckt als maximale Unterschiede 



Genort 


Unterschiede 


bevorzugte Unterschiede 


LTR 


17% 


15 % 


GAG 


29% 


28% 


POL 


25% 


24% 


VIF 


31 % 


30 % 


ENV 


46 % 


45 % 


NEF 


16 % 


12% 



besonders bevorzugte 
Unterschiede 



10% 
14% 
12 % 
15 % 
22 % 
10 % 



Die in Tabelle 9 angegebenen Homologiewerte in % bedeuten, daB bei einer GegenQberstellung der 
Sequenz gemafi Fig. 4 mit einer Sequenz eines anderen Virus hochstens ein den oben angegebenen 
Prozentwerten entsprechender Anteil der Sequenz unterschiedlich sein darf. 

Beispiel 13 

V3-loop / V3-Schlaufe 

Diese Schlaufe ist die hauptneutralisierende Region im HIV und die Dokumentation der immunologi- 
schen Spezifitaten der Region sind in der Figur 8 zusammengefaSt. Dies ist eine Kopie aus AIDS aus einer 
Arbeit von Peter Nara (1990). 

Die V3-Schlaufe ist dann in Aminosauren-Ebene aufgezeichnet und mit dem IIIB Virus jetzt LAI und dem 
ersten HIV-2 Isolat (ROD) verglichen. Einzelne Aminosauren an der Cystin-Brucke sind konserviert. 
Wahrend die Krone von HIV-1 GPGR Oder GPGQ ist und die von HIV-2 GHVF ist die Krone des 
MvP51 80/91 gebildet aus den Aminosauren GPMR. Das Motiv mit dem Methionin ist bisher nicht 
beschrieben worden und unterstreicht die Individualist des MvP 5180/91 . 

Nachdem die Nukleinsauresequenz des Virus ermittelt war, wurde der V3-Loop-Bereich mit Hilfe der 
PCR-Technik unter Verwendung geeigneter Primer amplifiziert. Hierbei konnten Mutationen beobachtet 
werden insbesondere eine VerSnderung des Metheonin-Kodons (ATG) zu einem Leucin-Kodon (CTG). 

Nachfolgend wird eine GegenQberstellung der von der klonierten Nukleinsaure abgeleiteten Aminosau- 
resequenz und der Sequenz gegeben, die nach Amplifizierung mittels PCR-Technologie erhalten wurde 
(Sequ. ID No. 54-55): 
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MvP 5180 (kloniert) : 

CIREGIAEVQDIYTGPMRWRSMTLKRSNNTSPRSRVAYC 
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MvP 5180 (PCR-Technik): 

CIREGIAEVQDLHTGPLRWRSMTLKKSSNSHTQPRSKVAYC 



50 
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Beispiel 14 

Urn zu zeigen, daB mit Hilfe des erfindungsgemMBen Virus MvP 5180 bzw. davon abgeleiteten 
Antigenen auch solche Seren als HIV-1 positiv nachgewiesen werden konnen, die bei Verwendung e.nes 
normalen HIV-1 +2 Screening-Tests nicht erlaBt werden konnen, wurden verschiedene Seren von Patienten 
aus Kamerun im EIA-Test Uberprdft. . 

Bei einer Studie in Kamerun wurden 156 Anti- HIV-1 -positive Seren Oberpruft. Bei zwei dieser Seren 
wurden erhebliche, diagnostisch relevante Unterschiede beobachtet. Bei der nachfolgenden Tabelle 10 
werden die gemessenen Extinktionen angegeben. CAM-A bzw. CAM-B stehen fUr die Seren verschiedener 
Patienten. 
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Tabelte 10 



Patientenseren 


MvP 5180-EIA 


HIV-1 + HIV-2 EIA 


CAM-A 
CAM-B 


2.886 
1.102 


1.623 
0.386 



Der Cutoff fOr beide Tests betrug 0.300. 

In einer weiteren Studie mit 47 Anti-HIV-1-positiven Seren aus Kamerun fielen zwei Seren besonders 
auf. Eines davon (93-1000) stammt von einem wenig symptomatischen, das andere (93-1001) von einem 
AIDS-kranken Patienten. In der folgenden Tabelle 11 werden die Extinktionswerte der beiden EIA-Tests 
einander gegenubergestellt: 



Tabelle 1 1 
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Patientenserum 


MvP 5180-EIA 


HIV-1 + HIV-2 EIA 


93-1000 
93-1001 


> 2.5 
0.692 


1.495 
0.314 



Auch hier betrug der Cutoff 0.3. Die Extinktionswerte des Patienten 93-1001 zeigen, daB der normale 
HIV-1 + HIV-2 EIA versagen kann, wohingegen durch Einsatz des erfindungsgemaBen Antigens ein klarer 
Nachweis moglich ist. 

25 
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(1) ALLGEME INE INFORMATION: 



ANMELDER: 

(A) NAME: Behringwerke Aktiengesellschaf t 

(B) STRASSE: Postfach 11 40 
35 (C) ORT: Marburg 

(E) LAND: Germany 

(F) POSTLEITZAHL: 35001 

ANMELDETITEL: 
40 Retrovirus aus der HIV-Gruppe und 

dessen Verwendung 

ANZAHL DER SEQUENZEN : 60 

45 COMPUTER— LESBARE FORM: 

(A) DATENTRAGER: Floppy Disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: PADAT Sequenzmodul Version 1.0 

50 
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(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 18 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 
CTACTAGTAC CCTTCAGG 



(2) INFORMATION SU SEQ ID 110: 2: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 
CGG TCT ACA TAG TCT CTA AAG 



(2) INFORMATION ZU SEQ ID NO: 3: - - 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE : 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D ) TOPOLOGIE : linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3 
CCACCTATCC CAGTAGGAGA A 
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(2) INFORMATION ZU SEQ ID NO: 4: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 30 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : synthetische DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 
CCTTTGGTCC TTGTCTTATG TCCAGAATGC 30 



(2) INFORMATION ZU SEQ ID NO: 



(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 25 Basenpaare 
20 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 
TGGGAAGTTC AATTAGGAAT ACCAC 25 



(2) INFORMATION Z0 SEQ ID NO: 6: 

(i) SEQUENZ CHARAKTERISTIKA : 
(A) LANGE: 26 Basenpaare 
35 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: synthetische DNA 

40 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 
CCTACATAGA AATCATCCAT GTATTG 26 

45 
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(2) INFORMATION 2U SEQ ID NO: 7; 

(i) SEQUENZ CHARACTER I ST I KA: 

(A) LANGE: 19 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 
TGGATGTGGG TGATGCATA 



(2) INFORMATION ZU SEQ ID NO: 8: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 8: 
AGCACATTGT ACTGATATCT A 



(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) L&NGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKuXS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 
AGT GGGGGGA CATCAAGCAG CC 



(2) INFORMATION ZU SEQ ID NO: 10. 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 
TGCTATGTCA CTTCCCCTTG GT 
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(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQUENZ CHARACTER I ST I KA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: synthetische DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 
CCATGCAAAT GTTAAAAGAG AC 22 



(2) INFORMATION ZU SEQ ID NO: 12: 



(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 19 Basenpaare 
20 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS; synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 
GGCCTGGTGC AATAGGCCC 19 

(2) INFORMATION ZU SEQ ID NO: 13: 



(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 20 Basenpaare 
35 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 
GTGCTTCCAC AGGGATGGAA 20 



(2) INFORMATION ZU SEQ ID NO: 14; 



(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 18 Basenpaare 
50 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 
ATCATCCATG TATTGATA 
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(2) INFORMATION ZU SEQ ID NO: 15: 

(i) SEQUENZ CHARAKTER ISTIKA : 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 
AATGGAGCCA GTAGATCCTA 



(2) INFORMATION ZU SEQ ID NO: 16: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 
TGTCTCCGCT TCTTCCTGCC 



(2) INFORMATION ZU SEQ ID NO: 17: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 
GAGCCCTGGA AGCATCCAGG 



(2) INFORMATION ZU SEQ ID NO: 18: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

( D ) TOPOLOGIE : linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 
GGAGATGCCT AAGGCTTTTG 
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(2) INFORMATION ZU SEQ ID NO: 19: 

(i) SEQUENZ CHARAKTER I ST I KA : 

(A) LANGE: 17 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 
TGTTCCTTGG GTTCTTG 



15 



(2) INFORMATION ZU SEQ ID NO: 20: 

(i) SEQUENZ CHARAKTERISTIKA: 
20 (A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKOLS: synthetische DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 
GAGTTTTCCA GAGCAACCCC 



(2) INFORMATION ZU SEQ ID NO: 21: 

(i) SEQUENZ CHARAKTERISTIKA: 
35 (A) LANGE: 20 Basenpaare 

( B ) ART : Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKOLS: synthetische DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 
AGCAGCAGGA AGCACTATGG 



(2) INFORMATION ZU SEQ ID NO: 22: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 
GCCCCAGACT GTGAGTTGCA ACAG 
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(2) INFORMATION ZU SEQ ID NO: 23: 

(i) SEQUENZ CHARAKTER I S T I KA : 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

( D ) TOPOLOGIE : 1 inear 

(ii) ART DES MOLEKtiLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 
GCACAGTACA ATGTACACAT GG 



(2) INFORMATION ZU SEQ ID NO: 24: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 
CAGTAGAAAA ATTCCCCTCC AC 



(2) INFORMATION ZU SEQ ID NO: 25: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 31 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS : synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 
TCAGGATCCA TGGGCAGTCT AGCAGAAGAA G 



(2) INFORMATION ZU SEQ ID NO: 26: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 42 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 
ATGCTCGAGA ACTGCAGCAT CGATTCT GGG TCCCCTCCTG AG 
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(2) INFORMATION ZU SEQ ID NO: 27: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 40 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS : synthetische DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 
CGAGAACTGC AGCATCGATG CTGCTCCCAA GAACCCAAGG 



(2) INFORMATION ZU SEQ ID NO: 28: 



(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 21 Basenpaare 
20 ( B ) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtfLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 
GGAGCTGCTT GATGCCCCAG A 



(2) INFORMATION ZU SEQ ID NO: 29: 

(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE : 22 Basenpaare 
35 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29 1 
TGATGACAGC ATGTCAGGGA GT 



(2) INFORMATION ZU SEQ ID NO: 30: 

(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 25 Basenpaare 
50 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKttLS: synthetische DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 
GCTGACATTT ATCACAGCTG GCTAC 
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(2) INFORMATION ZU SEQ ID NO: 31: 

(i) SEQUENZ CHARAKTER I ST I KA : 

(A) LANGE: 27 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 
TAT CACCT AG AACTTTAAAT GCATGGG 



(2) INFORMATION ZU SEQ ID NO: 32: 

(i) SEQUENZ CHARAKTER I ST I KA : 
(A) LANGE: 22 Basenpaare 
20 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: synthetische DNA 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 
AGTCCCTGAC ATGCTGTCAT CA 



(2) INFORMATION ZU SEQ ID NO: 33: 

(i) SEQUENZ CHARAKTER I ST I KA: 

(A) LANGE : 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 
GTGGAGGGGA ATTTTTCTAC TG 



(2) INFORMATION ZU SEQ ID NO: 34: 

(i) SEQUENZ CHARAKTER I ST IKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34 
CCTGCTGCTC CCAAGAACCC AAGG 
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(2) INFORMATION ZU SEQ ID NO: 35: 

(i) SEQUENZ CHARACTER I ST IKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TO PO LOG IE : linear 

(ii) ART DES MOLEKULS : Primer 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: 
AGCAGCAGGA AGCACTATGG 20 



(2) INFORMATION ZU SEQ ID NO: 36: 



(i) SEQUENZ CHARAKTER I ST I KA : 
(A) LANGE: 20 Basenpaare 
20 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOFOLOGIE: linear 

(ii) ART DES MOLEKtfLS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: 



GAGTTTTCCA GAGCAACCCC 20 



(2) INFORMATION ZU SEQ ID NO: 37: 



(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 195 Basenpaare 
35 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: Genom-DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

GCGCAGCGGC AACAGCGCTG ACGGTACGGA CCCACAGTGT ACTGAAGGGT ATAGTGCAAC 60 

AGCAGGACAA CCTGCTGAGA GCGATACAGG CCCAGCAACA CTTGCTGAGG TTATCTGTAT 120 

GGGGTATTAG ACAACTCCGA GCTCGCCTGC AAGCCTTAGA AACCCTTATA CAGAATCAGC 180 

AACGCCTAAA CCTAT X95 
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(2) INFORMATION ZU SEQ ID NO: 38: 

(i) SEQUENZ CHARAKTER I ST I KA : 

(A) L&NGE: 195 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtfLS: Genom-DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: 

CGCGTCGCCG TTGTCGCGAC TGCCATGCCT GGGTGTCACA TGACTTCCCA TATCACGTTG 60 

TCGTCCTGTT GGACGACTCT CGCTATGTCC GGGTCGTTGT GAACGACTCC AATAGACATA 120 

CCCCATAATC TGTTGAGGCT CGAGCGGACG TTCGGAATCT TTGGGAATAT GTCTTAGTCG 180 

TTGCGGATTT GGATA 195 



(2) INFORMATION ZU SEQ ID NO: 39: 

(i) SEQUENZ CHARAKT ER I ST I KA : 
25 (A) LANGE: 64 Aminosauren 

(B) ART: Amino saure 

(C) STRANGFORM: Einzel 

( D ) TOPOLOGIE : 1 inear 

(ii) ART DES MOLEKOLS : Protein 

(v) ART DES FRAGMENTS: inneres 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 39: 

Ala Ala Ala Thr Ala Leu Thr Val Arg Thr His Ser Val Leu Lys Gly 
15 10 15 

lie Val Gin Gin Gin Asp Asn Leu Leu Arg Ala lie Gin Ala Gin Gin 
20 25 30 

His Leu Leu Arg Leu Ser Val Trp Gly He Arg Gin Leu Arg Ala Arg 
35 40 45 

Leu Gin Ala Leu Glu Thr Leu He Gin Asn Gin Gin Arg Leu Asn Leu 
45 5 q 55 60 
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(2) INFORMATION ZU SEQ ID NO: 40: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtfLS: Primer 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 40: 
CAGAATCAGC AACGCCTAAA CC 



(2) INFORMATION ZU SEQ ID NO: 41: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Primer 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41: 
GCCCTGTCTT ATTCTTCTAG G 



(2) INFORMATION ZU SEQ ID NO: 42: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 42: 
GCCTGCAAGC CTTAGAAACC 



(2) INFORMATION ZU SEQ ID NO: 43: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 23 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKfiLS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 
GCACTATACC CTTCAGTACA CTG 
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(2) INFORMATION ZU SEQ ID NO: 44: 

(i) SEQUENZ CHARAKTER I ST I KA : 

(A) LANGE: 1057 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Genom-DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 





AAATGTCAAG 


ACCAATAATA 


AACATTCACA 


CCCCTCACAG 


GGAAAAAAGA 


GCAGTAGGAT 


60 




TGGGAATGCT 


ATTCTTGGGG 


GTGCTAAGTG 


CAGCAGGTAG 


CACTATGGGC 


GCAGCGGCAA 


120 


75 


CAGCGCTGAC 


GGTACGGACC 


CACAGTGTAC 


TGAAGGGTAT 


AGTGCAACAG 


CAGGACAACC 


180 




TGCTGAGAGC 


GATACAGGCC 


CAGCAACACT 


TGCTGAGGTT 


ATCTGTATGG 


GGTATTAGAC 


240 




AACTCCGAGC 


TCGCCTGCAA 


GCCTTAGAAA 


CCCTTATACA 


GAATCAGCAA 


CGCCTAAACC 


300 


20 


TATGGGGCTG 


TAAAGGAAAA 


CTAATCTGTT 


ACACATCAGT 


AAAATGGAAC 


ACATCATGGT 


360 




CAGGAGGATA 


TAATGATGAC 


AGTATTTGGG 


ACAACCTTAC 


ATGGCAGCAA 


TGGGACCAAC 


420 




ACATAAACAA 


TGTAAGCTCC 


ATTATATATG 


ATGAAATACA 


AGCAGCACAA 


GACCAACAGG 


480 


25 _ 


AAAAGAATGT 


AAAAGCATTG 


TTGGAGCTAG 


ATGAATGGGC 


CTCTCTTTGG 


AATTGGTTTG 


540 




A CAT AAC T AA 


ATGGTTGTGG 


TATATAAAAA 


TAGCTATAAT 


CAT AGT GGGA 


GCACTAATAG 


600 




GTATAAGAGT 


TATCATGATA 


GTACTTAATC 


TAGTGAAGAA 


CATTAGGCAG GGATATCAAC 


660 


30 


CCCTCTCGTT 


GCAGATCCCT 


GTCCCACACC 


GGCAGGAAGC 


AGAAACGCCA 


GGAAGAACAG 


720 




GAGAAGAAGG 


TGGAGAAGGA 


GACAGGCCCA 


AGTGGACAGC 


CTTGCCACCA 


GGATTCTTGC 


780 




AACAGTTGTA 


CACGGATCTC 


AGGACAATAA 


TCTTGTGGAC 


TTACCACCTC 


TTGAGCAACT 


840 


35 


TAATATCAGG 


GATCCGGAGG 


CTGATCGACT 


ACCTGGGACT 


GGGACTGTGG 


ATCCTGGGAC 


900 




AAAAGACAAT 


TGAAGCTTGT 


AGACTTTGTG 


GAGCTGTAAT 


GCAATATTGG 


CTACAAGAAT 


960 




TGAAAAATAG 


TGCTACAAAC 


CTGCTTGATA 


CTATTGCAGT 


GTCAGTTGCC 


AATTGGACTG 


1020 


40 


AC GG CAT CAT 


CTTAGGTCTA 


CAAAGAATAG 


GACAAGG 






1057 
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55 
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(2) INFORMATION ZU SEQ ID NO: 45: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGS: 1057 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: Genom-DNA 



10 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 45: 





TTTACAGTTC 


TGGTTATTAT 


TTGTAAGTGT 


GGGGAGTGTC 


CCTTTTTTCT 


CGTCATCCTA 


60 




ACCCTTACGA 


TAAGAACCCC 


CACGATTCAC 


GTCGTCCATC 


GTGATACCCG 


CGTCGCCGTT 


120 


75 


GTCGCGACTG 


CCATGCCTGG 


GTGTCACATG 


ACTTCCCATA 


TCACGTTGTC 


GTCCTGTTGG 


180 




ACGACTCTCG 


CTATGTCCGG 


GTCGTTGTGA 


ACGACTCCAA 


TAGACATACC 


CCATAATCTG 


240 




TTGAGGCTCG 


AGCGGACGTT 


CGGAATCTTT 


GGGAATATGT 


CTTAGTCGTT 


GCGGATTTGG 


300 


20 


ATACCCCGAC 


ATTTCCTTTT 


GATTAGACAA 


TGTGTAGTCA 


TTTTACCTTG 


TGTAGTACCA 


360 




GTCCTCCTAT 


ATTACTACTG 


TCATAAACCC 


TGTTGGAATG 


TACCGTCGTT 


ACCCTGGTTG 


420 




TGTATTTGTT 


ACATTCGAGG 


TAATATATAC 


TACTTTATGT 


TCGTCGTGTT 


CTGGTTGTCC 


480 


25 


TTTTCTTACA 


TTTTCGTAAC 


AACCTCGATC 


TACTTACCCG 


GAGAGAAACC 


TTAACCAAAC 


540 




TGTATTGATT 


TACCAACACC 


ATATATTTTT 


ATCGATATTA 


GTATCACCCT 


CGTGATTATC 


600 




CATATTCTCA 


ATAGTACTAT 


CATGAATTAG 


ATCACTTCTT 


GTAATCCGTC 


CCTATAGTTG 


660 


30 


GGGAGAGCAA 


CGTCTAGGGA 


CAGGGTGTGG 


CCGTCCTTCG 


TCTTTGCGGT 


CCTTCTTGTC 


720 




CTCTTCTTCC 


ACCTCTTCCT 


CTGTCCGGGT 


TCACCTGTCG 


GAACGGTGGT 


CCTAAGAACG 


780 




TTGTCAACAT 


GTGCCTAGAG 


TCCTGTTATT 


AGAACACCTG 


AATGGTGGAG 


AACTCGTTGA 


840 


35 


ATTATAGTCC 


CTAGGCCTCC 


GACTAGCTGA 


TGGACCCTGA 


CCCTGACACC 


TAGGACCCTG 


900 




TTTTCTGTTA 


ACTTCGAACA 


TCTGAAACAC 


CTCGACATTA 


CGTTATAACC 


GATGTTCTTA 


960 




ACTTTTTATC 


ACGATGTTTG 


GACGAACTAT 


GATAACGTCA 


CAGTCAACGG 


TTAACCTGAC 


1020 


40 


TGCCGTAGTA 


GAATCCAGAT 


GTTTCTTATC 


CTGTTCC 






1057 



45 
50 
55 
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(2) INFORMATION ZU SEQ ID NO: 46: 

(i) SEQUENZ CHARAKTER I ST I KA : 

(A) LANGE: 351 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART PES MOLEKtjfLS : Protein 

(v) ART DES FRAGMENTS: inneres 

(xi) SEQUENZ BE SCHRE I BUNG : SEQ ID NO: 46: 

Met Ser Arg Pro lie lie Asn lie His Thr Pro His Arg Glu Lys Arg 
15 10 15 

15 A ia val Gly Leu Gly Met Leu Phe Leu Gly Val Leu Ser Ala Ala Gly 

20 25 30 

Ser Thr Met Gly Ala Ala Ala Thr Ala Leu Thr Val Arg Thr His Ser 
35 40 45 

20 val Leu Lys Gly lie Val Gin Gin Gin Asp Asn Leu Leu Arg Ala lie 

50 55 60 

Gin Ala Gin Gin His Leu Leu Arg Leu Ser Val Trp Gly He Arg Gin 
65 70 75 80 



25 



Leu Arg Ala Arg Leu Gin Ala Leu Glu Thr Leu He Gin Asn Gin Gin 
85 90 95 

Arg Leu Asn Leu Trp Gly Cys Lys Gly Lys Leu He Cys Tyr Thr Ser 
100 105 110 

Val Lys Trp Asn Thr Ser Trp Ser Gly Gly Tyr Asn Asp Asp Ser He 
30 * 115 120 125 

Trp Asp Asn Leu Thr Trp Gin Gin Trp Asp Gin His He Asn Asn Val 
130 135 140 

Ser Ser He He Tyr Asp Glu He Gin Ala Ala Gin Asp Gin Gin Glu 

35 145 150 155 160 

Lys Asn Val Lys Ala Leu Leu Glu Leu Asp Glu Trp Ala Ser Leu Trp 
165 170 175 



40 



45 



50 



Asn Trp Phe Asp He Thr Lys Trp Leu Trp Tyr He Lys He Ala He 

180 185 190 

lie He Val Gly Ala Leu He Gly He Arg Val He Met He Val Leu 
195 200 205 

Asn Leu Val Lys Asn He Arg Gin Gly Tyr Gin Pro Leu Ser Leu Gin 
210 215 220 

He Pro val Pro His Arg Gin Glu Ala Glu Thr Pro Gly Arg Thr Gly 
225 230 235 240 

Glu Glu Gly Gly Glu Gly Asp Arg Pro Lys Trp Thr Ala Leu Pro Pro 
245 250 255 

Gly Phe Leu Gin Gin Leu Tyr Thr Asp Leu Arg Thr He He Leu Trp 

260 265 270 



55 
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Thr Tyr His Leu Leu Ser Asn Leu He Ser Gly He Arg Arg Leu He 

275 280 285 

5 Asp Tyr Leu Gly Leu Gly Leu Trp He Leu Gly Gin Lys Thr He Glu 

290 295 300 

Ala Cys Arg Leu Cys Gly Ala Val Met Gin Tyr Trp Leu Gin Glu Leu 

305 310 315 320 



10 



75 



20 



25 



30 



35 



55 



Lys Asn Ser Ala Thr Asn Leu Leu Asp Thr He Ala Val Ser Val Ala 

325 330 335 

Asn Trp Thr Asp Gly He He Leu Gly Leu Gin Arg He Gly Gin 
340 345 350 



(2) INFORMATION ZU SEQ ID NO: 47: 

(i) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES M0LEK0LS: Primer 

(xi) SEQUENZ BE SCHRE I BUNG : SEQ ID NO: 47: 
CTAGCAGTGG CGCCCGAACA GG 22 



(2) INFORMATION FOR SEQ ID NO: 48: 



(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 23 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : single 
40 (D) TOPOLOGY : linear 

(ii) MOLECULE TYPE: Primer 

45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48: 

AATGAGGAAG CUGCAGAUTG GGA 23 



50 
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(2) INFORMATION FOR SEQ ID NO: 49: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 23 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : single 

(D) TOPOLOGY: linear 

(ii) MOLECULE TYPE: Primer 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 
75 TCCCAUTCTG CUGCTTCCTC ATT 



(2) INFORMATION ZU SEQ ID NO: 50: 

(i) SEQUENZ CHARAKTER I ST I KA : 

(A) LANGE: 26 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS : Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 50: 
CCAAGGGGAA GTGACATAGC AGGAAC 



35 

(2) INFORMATION ZU SEQ ID NO: 51: 

(i) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 
40 (C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 51: 
CGTTGTTCAG AATTCAAACC C 



38 
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(2) INFORMATION ZU SEQ ID NO: 52: 

(i) SEQUENZ CHARACTER I ST I KA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Primer 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 52: 
TCCCTAAAAA ATTAGCCTGT C 21 

(2) INFORMATION ZU SEQ ID NO: 53: 

(i) SEQUENZ CHARAKTERI STIKA : 
(A) LANGE: 19 Basenpaare 
20 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 



15 



25 



30 



40 



SO 



(ii) ART DES MOLEKtlLS: Genom-DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 53: 
AAACCTCCAA TTCCCCCTA 

(2) INFORMATION ZU SEQ ID NO: 54: 



(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 39 Aminosauren 
35 (B) ART: Aroinosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 



19 



(ii) ART DES MOLEKOLS: Protein 

(v) ART DES FRAGMENTS: inneres 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 54: 

45 Cys lie Arg Glu Gly lie Ala Glu Val Gin Asp lie Tyr Thr Gly Pro 
15 10 15 

Met Arg Trp Arg Ser Met Thr Leu Lys Arg Ser Asn Asn Thr Ser Pro 
20 25 30 



Arg Ser Arg Val Ala Tyr Cys 
35 



55 
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(2) INFORMATION ZU SEQ ID NO: 55: 

(i) SEQUENZ CHARAKTER I ST I KA : 
s (A) LANGE: 41 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOFOLOGIE: linear 

10 (ii) ART DES MOLEKULS: Protein 

(v) ART DES FRAGMENTS: inneres 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 55: 

15 Cvs He Arg Glu Gly He Ala Glu Val Gin Asp Leu His Thr Gly Pro 
15 10 15 

Leu Arg Trp Arg Ser Met Thr Leu Lys Lys Ser Ser Asn Ser His Thr 
20 25 30 

20 

Gin Pro Arg Ser Lys Val Ala Tyr Cys 
35 40 



30 



35 



40 



46 



50 



55 



40 

BNSDOCID: <EP 0591914A2_1_> 



EP 0 591 914 A2 



(2) INFORMATION ZU SEQ ID NO: 56: 



10 



15 



20 



25 



30 



35 



40 



45 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 9793 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Ein2el 
<D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS: Genom-DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: 
CTGGATGGGT TAATTTACTC CCATAAGAGA GCAGAAATCC TGGATCTCTG GATATATCAC 
ACTCAGGGAT TCTTCCCTGA TTGGCAGTGT TACACACCGG GACCAGGACC TAGATTCCCA 
CTGACATTTG GATGGTTGTT TAAACTGGTA CCAGTGTCAG CAGAAGAGGC AGAGAGACTG 
GGTAATACAA ATGAAGATGC TAGTCTTCTA CATCCAGCTT GTAATCATGG AGCTGAGGAT 
GCACACGGGG AGATACTAAA ATGGCAGTTT GATAGATCAT TAGGCTTAAC ACATATAGCC 
CTGCAAAAGC ACCCAGAGCT CTTCCCCAAG TAACTGACAC TGCGGGACTT TCCAGACTGC 
TGACACTGCG GGGACTTTCC AGCGTGGGAG GGATAAGGGG CGGTTCGGGG AGTGGCTAAC 
CCTCAGATGC TGCATATAAG CAGCTGCTTT CCGCTTGTAC CGGGTCTTAG TTAGAGGACC 
AGGTCTGAGC CCGGGAGCTC CCTGGCCTCT AGCTGAACCC GCTGCTTAAC GCTCAATAAA 
GCTTGCCTTG AGTGAGAAGC AGTGTGTGCT CATCTGTTCA ACCCTGGTGT CTAGAGATCC 
CTCAGATCAC TTAGACTGAA GCAGAAAATC TCTAGCAGTG GCGCCCGAAC AGGGACGCGA 
AAGT GAAAGT GGAACCAGGG AAGAAAACCT CCGACGCAAC GGGCTCGGCT TAGCGGAGTG 
CACCTGCTAA GAGGCGAGAG GAACTCACAA GAGGGTGAGT AAATTTGCTG GCGGTGGCCA 
GACCTAGGGG AAGGGCGAAG TCCCTAGGGG AGGAAGATGG GTGCGAGAGC GTCTGTGTTG 
ACAGGGAGTA AATTGGATGC ATGGGAACGA ATTAGGTTAA GGCCAGGATC TAAAAAGGCA 
TATAGGCTAA AACATTTAGT ATGGGCAAGC AGGGAGCTGG AAAGATACGC ATGTAATCCT 
GGTCTATTAG AAACTGCAGA AGGTACTGAG CAACTGCTAC AGCAGTTAGA GCCAGCTCTC 
AAGACAGGGT CAGAGGACCT GAAATCTCTC TGGAACGCAA TAGCAGTACT CTGGTGCGTT 
CACAACAGAT TTGACATCCG AGATACACAG CAGGCAATAC AAAAGTTAAA GGAAGTAATG 
GCAAGGAGGA AGTCTGCAGA GGCCGCTAAG GAAGAAACAA GCCCTAGGCA GACAAGTCAA 
AATTACCCTA TAGTAACAAA TGCACAGGGA CAAATGGTAC ATCAAGCCAT CTCCCCCAGG 
ACTTTAAATG CATGGGTAAA GGGAGTAGAA GAGAAGGCCT TTAACCCTGA AATTATTCCT 
ATGTTTATGG CATTATCAGA AGGGGCTGTC CCCTATGATA TCAATACCAT GCTGAATGCC 
ATAGGGGGAC ACCAAGGGGC TTTACAAGTG TTGAAGGAAG TAATCAATGA GGAAGCAGCA 
GAATGGGATA GAACTCATCC ACCAGCAATG GGGCCGTTAC CACCAGGGCA GATAAGGGAA 
CCAACAGGAA GTGACATTGC TGGAACAACT AGCACACAGC AAGAGCAAAT TATATGGACT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
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ACTAGAGGGG 


CTAACTCTAT 


CCCAGTAGGA 


GACATCTATA 


GAAAATGGAT 


AGTGCTAGGA 


1620 




CTAAACAAAA 


TGGTAAAAAT 


GTACAGTCCA 


GTGAGCATCT 


TAGATATTAG 


GCAGGGACCA 


1680 


5 


AAAGAACCAT 


TCAGAGATTA 


TGTAGATCGG 


TTTTACAAAA 


CATTAAGAGC 


TGAGCAAGCT 


174C 




A Vat J- t-jfV/*VJTVf*\J 


TAAAGAATTG 


GATGACAGAA 


ACCTTGCTTG 


TTCAGAATTC 


AAACCCAGAT 


1800 




lljXAAnUtnn 


TTCTGAAAGC 


ATTAGGACCA 


GAAGCTACTT 


TAGAAGAAAT 


GATGGTAGCC 


1860 


10 


TGTCAAGGAG 


TAGGAGGGCC 


AACTCACAAG 


GCAAAAATAC 


TAGCAGAAGC 


AATGGCTTCT 


1920 


GCCCAGCAAG 


AT T TAAAAGG 


AGGATACACA 


GCAGTATTCA 


TGCAAAGAGG 


GCAGAATCCA 


1980 




AATAGAAAAG 


GGCCCATAAA 


ATGCTTCAAT 


TGTGGAAAAG 


AGGGACATAT 


AGCAAAAAAC 


2040 




TGTCGAGCAC 


CTAGAAAAAG 


GGGTTGCTGG 


AAATGTGGAC 


AGGAAGGTCA 


CCAAATGAAA 


2100 


15 


GATTGCAAAA 


ATGGAAGACA 


GGCAAATTTT 


TTAGGGAAGT 


ACTGGCCTCC 


GGGGGGCACG 


2160 




AGGCCAGGCA 


ATTATGTGCA 


GAAACAAGTG 


TCCCCATCAG 


CCCCACCAAT 


GGAGGAGGCA 


2220 




GTGAAGGAAC AAGAGAATCA 


GAGTCAGAAG 


GGGGATCAGG 


AAGAGCTGTA 


CCCATTTGCC 


2280 


20 


TCCCTCAAAT 


CCCTCTTTGG 


GACAGACCAA 


TAGTCACAGC 


AAAGGTTGGG 


GGTCATCTAT 


2340 




GTGAGGCTTT 


ACTGGATACA 


GGGGCAGATG 


ATACAGTATT 


AAATAACATA 


CAATTAGAAG 


2400 




GAAGATGGAC 


ACCAAAAATG 


ATAGGGGGTA 


TAGGAGGCTT 


TATAAAAGTA 


AAAGAGTATA 


2460 


25 


ACAATGTGAC 


AGTAGAAGTA 


CAAGGAAAGG 


AAGTACAGGG 


AACAGTATTG 


GTGGGACCTA 


2520 


CTCCTGTTAA 


TATTCTTGGG 


AGAAACATAT 


TGACAGGATT 


AGGATGTACA 


CTAAATTTCC 


2580 




CTATAAGTCC 


CATAGCCCCA 


GTGCCAGTAA 


AGCTAAAACC 


AGGAATGGAT 


GGACCAAAAG 

i 


2640 




TAAAACAATG 


GCCCCTATCT 


AGAGAGAAAA 


TAGAAGCACT 


AACTGCAATA 


-TGTCAAGAAA 


2700 


30 


TGGAACAGGA 


AGGAAAAATC 


TCAAGAATAG 


GACCTGAAAA 


TCCTTATAAT 


ACACCTATTT 


2760 




TTGCTATAAA 


AAAGAAAGAT 


AGCACTAAGT 


GGAGAAAATT 


GGTAGACTTC 


AGAGAATTAA 


2820 




ATAAAAGAAC 


ACAAGATTTC 


TGGGAGGTGC 


AATTAGGTAT 


TCCACATCCA 


GGGGGTTTAA 


2880 


35 


AGCAAAGGCA ATCTGTTACA 


GTCTTAGATG 


TAGGAGATGC 


TTATTTCTCA 


TGCCCTTTAG 


2940 




ATCCAGACTT 


TAGAAAATAC 


ACTGCCTTCA 


CTATTCCTAG 


TGTGAACAAT 


GAGACCCCAG 


3000 




GAGTAAGATA 


CCAGTACAAT 


GTCCTCCCGC 


AAGGGTGGAA 


AGGTTCACCA 


GCCATATTTC 


3060 


40 


AGAGTTCAAT 


GACAAAGATT 


CTAGATCCAT 


TTAGAAAAAG 


CAACCCAGAA 


GTAGAAATTT 


3120 


ATCAGTACAT 


AGATGACTTA 


TATGTAGGAT 


CAGATTTACC 


ATTGGCAGAA 


CATAGAAAGA 


3180 




GGGTCGAATT 


GCTTAGGGAA 


C A T TT AT AT C 


AGTGGGGATT 


TACTACCCCT 


GATAAAAAGC 


3240 




ATCAGAAGGA 


ACCTCCCTTT 


TT AT GGATGG 


GATATGAGCT 


CCACCCAGAC 


AAGTGGACAG 


3300 


45 


TACAGCCCAT 


CCAATTGCCT 


GACAAAGAAG 


TGTGGACAGT 


AAATGATATA 


CAAAAATTAG 


3360 




TAGGAAAATT 


AAATTGGGCA 


AGTCAAATCT 


ATCAAGGAAT 


TAGAGTAAAA 


GAATTGTGCA 


3420 




AGTTAATCAG 


AGGAACCAAA 


TCATTGACAG 


AGGTAGTACC 


TTTAAGTAAA 


GAGGCAGAAC 


3480 


50 


TAGAATTAGA 


AGAAAACAGA 


GAAAAGCTAA 


AAGAGCCAGT 


ACATGGAGTA 


TATTACCAGC 


3540 




CTGACAAAGA 


CTTGTGGGTT 


AGTATTCAGA 


AGCATGGAGA 


AGGGCAATGG 


ACTTACCAGG 


3600 
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w 



15 



20 



25 



30 



35 



40 



45 



50 



TATATCAGGA TGAACATAAG AACCTTAAAA CAGGAAAATA TGCTAGGCAA AAGGCCTCCC 366C 

ACACAAATGA TATAAGACAA TTGGCAGAAG TAGTCCAGAA GCTGTCTCAA GAASCTATAG 372C 

TTATATGGGG GAAATTACCT AAATTCAGGC TGCCAGTTAC TAGAGAAACT TGGGAAACTT 378C 

GGTGGGCAGA ATATTGGCAG GCCACCTGGA TTCCTGAATG GGAATTTGTC AGCACACCCC 3840 

CATTGATCAA ATTATGGTAC CAGTTAGAAA CAGAACCTAT TGTAGGGGCA GAAACCTTTT 3900 

ATGTAGATGG AGCAGCTAAT AGGAATACAA AACTAGGAAA GGCGGGATAT GTTACAGAAC 3960 

AAGGAAAACA GAACATAATA AAGTTAGAAG AGACAACCAA TCAAAAGGCT GAATTAATGG 4020 

CTGTATTAAT AGCCTTGCAG GATTCCAAGG AGCAAGTAAA CATAGTAACA GACTCACAAT 4080 

ATGTATTGGG CATCATATCC TCCCAACCAA CACAGAGTGA CTCCCCTATA GTTCAGCAGA 4140 

TAATAGAGGA ACTAACAAAA AAGGAACGAG TGTATCTTAC ATGGGTTCCT GCTCACAAAG 4200 

GCATAGGAGG AAATGAAAAA ATAGATAAAT TAGTAAGCAA AGACATTAGA AGAGTCCTGT 4260 

TCCTGGAAGG AATAGATCAG GCACAAGAAG ATCATGAAAA ATATCATAGT AATTGGAGAG 4320 

CATTAGCTAG TGACTTTGGA TTACCACCAA TAGTAGCCAA GGAAATCATT GCTAGTTGTC 4380 

CTAAATGCCA TATAAAAGGG GAAGCAACGC ATGGTCAAGT AGACTACAGC CCAGAGATAT 4440 

GGCAAATGGA TTGTACACAT TTAGAAGGCA AAATCATAAT AGTTGCTGTC CATGTAGCAA 4500 

GTGACTTTAT AGAAGCAGAG GTGATACCAG CAGAAACAGG ACAGGAAACT GCCTATTTCC 4560 

TGTTAAAATT AGCAGCAAGA TGGCCTGTCA AAGTAATACA TACAGACAAT GGACCTAATT 4620 

TTACAAGTGC AGCCATGAAA GCTGCATGTT GGTGGACAGG CATACAACAT GAGTTTGGGA 4680 

TAC CATATAA TCCACAAAGT CAAGGAGTAG TAGAAG C CAT GAATAAAGAA TTAAAATCTA 4740 

TTATACAGCA GGTGAGGGAC CAAGCAGAGC ATTTAAAAAC AGCAGTACAA ATGGCAGTCT 4800 

TTGTTCACAA TTTTAAAAGA AAAGGGGGGA TTGGGGGGTA CACTGCAGGG GAGAGACTAA 4860 

TAGACATACT AGCATCACAA ATACAAACAA CAGAACTACA AAAACAAATT TTAAAAATCA 4920 

ACAATTTTCG GGTCTATTAC AGAGATAGCA GAGACCCTAT TTGGAAAGGA CCGGCACAAC 4980 

TCCTGTGGAA AGGTGAGGGG GCAGTAGTCA TACAAGATAA AGGAGACATT AAAGTGGTAC 5040 

CAAGAAGAAA GGCAAAAATA ATCAGAGATT ATGGAAAACA GATGGCAGGT ACTGATAGTA 5100 

T G GCAAA TAG ACAGACAGAA AGTGAAAGCA TGGAACAGCC TGGTGAAATA CCATAAATAC 5160 

ATGTCTAAGA AGGCCGCGAA CTGGCGTTAT AGGCATCATT ATGAATCCAG GAATCCAAAA 5220 

GTCAGTTCGG CGGTGTATAT TCCAGTAGCA GAAGCTGATA TAGTGGTCAC CACATATTGG 5280 

GGATTAATGC CAGGGGAAAG AGAGGAACAC TTGGGACATG GGGTTAGTAT AGAATGGCAA 5340 

TACAAGGAGT ATAAAACACA GATTGATCCT GAAACAGCAG ACAGGATGAT ACATCTGCAT 5400 

TATTTCACAT GTTTTACAGA ATCAGCAATC AGGAAGGCCA TTCTAGGGCA GAGAGTGCTG 5460 

ACCAAGTGTG AATACCTGGC AGGACATAGT CAGGTAGGGA CACTACAATT CTTAGCCTTG 5520 

AAAGCAGTAG TGAAAGTAAA AAGAAATAAG CCTCCCCTAC CCAGTGTCCA GAGATTAACA 5580 
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fSAAGATAGAT 

VjAnun x A wa 


GGAACAAGCC 


CTGGAAAATC 


AGGGACCAGC 


TAGGGAGCCA 


TTCAATGAAT 


564C 




V_JVJ"V^AL X AVJA 


GCTCCTGGAA 


GAG CT GAAAG 


AAGAAGCAGT 


AAGACATTTC 


CCTAGGCCTT 


570C 


5 


GGTTACAAGC 


CTGTGGGCAG 


TACATTTATG 


AGACTTATGG 


AGACAGTTGC 


GAAGGAGTTA 


576C 






AAGAATCTTA 


CAACAACTAC 


TGTTTACCCA 


TTATAGAATT 


GGATGCCAAC 


5820 




AX AOX AVJAAX 


AGGAATTCTC 


CCATCTAACA 


CAAGAGGAAG 


AGGAAGAAGA 


AATGGATCCA 


5880 






AGATGCCCCC 


TTGGCATCAC 


CCTGGGAGCA 


AGCCCCAAAC 


CCCTTGTAAT 


5940 


70 


AA1 X UOiAl X 


GCAAAAGATG 


CTGCTATCAT 


TGCTATGTTT 


GTTTCACAAA 


GAAGGGTTTG 


6000 






AT GGCAGGAA 

A X W WwlVJWl** 


GAAGCGAAGA 


AGACCAGCAG 


CTGCTGCAAG 


CTATCCAGAT 


6060 




AA 1 AAAvjrA X v_ 


PTGTAPPAGA 


GCAGTAAGTA 


ACGCTGATGC 


ATCAAGAGAA 


CCTGCTAGCC 


6120 


75 


TTAAlAuLl 1 


ip» AfJTRPTTT 


GTGTCTTATA 


AATGTACTTA 


TATGGTTGTT 


TAACCTTAGA 


6180 




ATT 1AX 1 lAu 


Tf?PA AAGAAA 


ACAAGATAGA 


AGGGAGCAGG 


AAATACTTGA 


AAGATTAAGG 


6240 




AuAAiAAAw 


A A ATPAGGGA 

AAA X LAwVJwA 


TGACAGTGAC 


TAT GAAAGT A 


ATGAAGAAGA 


ACAACAGGAA 


6300 


20 


r^rp/-> tv »T*f~ , f2 & f5P 

LjXLA X UuAuU 


TTATAP-ATAG 


CCATGGCTTT 


GCTAATCCCA 


TGTTTGAGTT 


ATAGTAAACA 


6360 




m mni< I im«mppp 

ATTGlAIuH* 


AU AVJX X XAX X 


CTGGGGTACC 


TGTATGGGAA 


GAGGCAGCAC 


CAGTACTATT 


6420 




CTGT(jC,± It— A 


A T f3P T A A P P 


TAACAAGCAC 


TGAACAGCAT 


AATATTTGGG 


CAT CACAAGC 


6480 


25 


ro /»* en 

CTGCGTTL.L. 1 




ATPCACATGA 


ATTTCCACTA 


GGCAATGTGA 


CAGATAACTT 


6540 


T GAT ATA I Cju 


AAA A ATT A PA 
aaaaaX lnv^ 


TGGTGGACCA 


AATGCATGAA 


GACATCATTA 


GTTTGTGGGA 


6600 




ACAGAGTTTA 


AACjCL. lluio 


AflAAAATGAC 

AUlAAAA X VJAV^- 


TTTCTTATGT 


GTACAAATGA 


ACTGTGTAGA 


6660 




TCTGCAAACA 


AAlAAAALnu 


nPPTATTAAA 


TGAGACAATA 


AATGAGATGA 


GAAATTGTAG 


6720 


30 


TTTTAATGTA 




TPAPAGACAA 


AAAGGAGCAA 


AAACAGGCTC 


TATTCTATGT 


6780 






AulAAUUl XA 


ATGACTCAAA 


TGCAGTAAAT 


GGAACAACAT 


AT AT GTT AAC 


6840 




m« jv rri rp/rp 7\ jv /~» 

TAATTGIAAt- 


TPPIPUTTA 
ILLAUinl XA 


TCAAGCAGGC 


CTGTCCGAAG 


GTAAGTTTTG 


AGCCCATTCC 


6900 


35 


CATACACTA 1 




PAGGATATGC 


CATCTTTAAG 


TGTAATGACA 


CAGACTTTAA 


6960 




TGGAACAGGC 


<—trp TV «T»/^ f*f* TV TA 

CTATGLLALA 


AT ATTTPAGT 

A X A X X lv#Aul 


GGTTACTTGT 


ACACATGGCA 


TCAAGCCAAC 


7020 




AGTAAGTACT 


✓1 IV TV Of TV TV 1* TV 

CAAUTAA 1AL 


X \3 AA X WWW* 


ACTCTCTAGA 


GAAAAGATAA 


GAATTATGGG 


7080 


40 


AAAAAATATT 


7\ /-» TV /"* 7A »nl/i»/; 


PA A AHAATAT 


CATAGTAACC 


CTAAACACTC 


CTATAAACAT 


7140 


GAC C T GCAT A 




TTGPAGAGGT 

X X UUiwAwU X 


ACAAGATATA 


TATACAGGTC 


CAATGAGATG 


7200 




GCGCAGTATG 


ACACT TAAAA 


* JV /2»p TV TV A A 
uAAVjIAALAA 


TAPATCACCA 


AGATCAAGGG 


TAGCTTATTG 


7260 




TACATATAAT 


AAGACTGTAT 


GGGAAAATGC 


CCTACAACAA 


ACAGCTATAA 


GGTATTTAAA 


7320 


45 


TCTTGTAAAC 


CAAACAGAGA 


ATGTTACCAT 


AATATTCAGC 


AGAACTAGTG 


GTGGAGATGC 


7380 




AGAAGTAAGC 


CATTTACATT 


TTAACTGTCA 


TGGAGAATTC 


TTTTATTGTA 


ACACATCTGG 


7440 




GATGTTTAAC 


TATACTTTTA 


TCAACTGTAC 


AAAGTCCGGA 


TGCCAGGAGA 


TCAAAGGGAG 


7500 


50 


CAATGAGACC 


AATAAAAATG 


GTACTATACC 


TTGCAAGTTA 


AGACAGCTAG 


TAAGATCATG 


7560 




GATGAAGGGA 


GAGTCGAGAA 


TCTATGCACC 


TCCCATCCCC 


GGCAACTTAA 


CATGTCATTC 


7620 
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CAACATAACT GGAATGATTC TACAGTTAGA TCAACCATGG AATTCCACAG GTGAAAATAC 7680 

ACTTAGACCA GTAGGGGGAG ATATGAAAGA TATATGGAGA ACTAA^TXGT ACAACTACAA 7740 

AGTAGTACAG ATAAAACCTT TTAGTGTAGC ACCTACAAAA ATGTCAAGAC CAATAATAAA 7800 

CATTCACACC CCTCACAGGG AAAAAAGAGC AGTAGGATTG GGAATGCTAT TCTTGGGGGT 7860 

GCTAAGTGCA GCAGGTAGCA CTATGGGCGC AGCGGCAACA GCGCTGACGG TACGGACCCA 7920 

CAGTGTACTG AAGGGTATAG TGCAACAGCA GGACAACCTG CTGAGAGCGA TACAGGCCCA 7980 

GCAACACTTG CTGAGGTTAT CTGTATGGGG TATTAGACAA CTCCGAGCTC GCCTGCAAGC 8040 

CTTAGAAACC CTTATACAGA ATCAGCAACG CCTAAACCTA TGGGGCTGTA AAGGAAAACT 8100 

AATCTGTTAC ACATCAGTAA AATGGAACAC ATCATGGTCA GGAAGATATA ATGATGACAG 8160 

TATTTGGGAC AACCTTACAT GGCAGCAATG GGACCAACAC ATAAACAATG TAAGCTCCAT 8220 

TATATATGAT GAAATACAAG CAGCACAAGA CCAACAGGAA AAGAATGTAA AAGCATTGTT 8280 

GGAGCTAGAT GAATGGGCCT CTCTTTGGAA TTGGTTTGAC ATAACTAAAT GGTTGTGGTA 8340 

TAT AAAAA T A GCTATAATCA TAGTGGGAGC ACTAATAGGT ATAAGAGTTA TTATGATAAT 8400 

ACTTAATCTA GTGAAGAACA TTAGGCAGGG ATATCAACCC CTCTCGTTGC AGATCCCTGT 8460 

CCCACACCGG CAGGAAGCAG AAACGCCAGG AAGAACAGGA GAAGAAGGTG GAGAAGGAGA 8520 

CAGGCCCAAG TGGACAGCCT TGCCACCAGG ATTCTTGCAA CAGTTGTACA CGGATCTCAG 8580 

GACAATAATC TTGTGGACTT ACCACCTCTT GAGCAACTTA ATATCAGGGA TCCGGAGGCT 8640 

GATCGACTAC CTGGGACTGG GACTGTGGAT CCTGGGACAA AAGACAATTG AAGCTTGTAG 8700 

ACTTTGTGGA GCTGTAATGC AATATTGGCT ACAAGAATTG AAAAATAGTG CTACAAACCT 8760 

GCTTGATACT ATTGCAGTGT CAGTTGCCAA TTGGACTGAC GGCATCATCT TAGGTCTACA 8820 

AAGAATAGGA CAAGGATTCC TTCACATCCC AAGAAGAATT AGACAAGGTG CAGAAAGAAT 8880 

CTTAGTGTAA CATGGGGAAT GCATGGAGCA AAAGCAAATT TGCAGGATGG TCAGAAGTAA 8940 

GAGATAGAAT GAGACGATCC TCCTCTGATC CTCAACAACC ATGTGCACCT GGAGTAGGAG 9000 

CTGTCTCCAG GGAGTTAGCA ACTAGAGGGG GAATATCAAG TTCCCACACT CCTCAAAACA 9060 

ATGCAGCCCT TGCATTCCTA GACAGCCACA AAGATGAGGA TGTAGGCTTC CCAGTAAGAC 9120 

CTCAAGTGCC TCTAAGGCCA ATGACCTTTA AAGCAGCCTT TGACCTCAGC TTCTTTTTAA 9180 

AAGAAAAGGG AGGACTGGAT GGGTTAATTT ACTCCCATAA GAGAGCAGAA ATCCTGGATC 9240 

TCTGGATATA TCACACTCAG GGATTCTTCC CTGATTGGCA GTGTTACACA CCGGGACCAG 9300 

GACCTAGATT CCCACTGACA TTTGGATGGT TGTTTAAACT GGTACCAGTG TCAGCAGAAG 9360 

AGGCAGAGAG ACTGGGTAAT ACAAATGAAG ATGCTAGTCT TCTACATCCA GCTTGTAATC 9420 

ATGGAGCTGA GGATGCACAC GGG GAGATAC TAAAATGGCA GTTTGATAGA TCATTAGGCT 9480 

TAACACATAT AGCCCTGCAA AAGCACCCAG AGCTCTTCCC CAAGTAACTG ACACTGCGGG 9540 

ACTTTCCAGA CTGCTGACAC TGCGGGGACT TTCCAGCGTG GGAGGGATAA GGGGCGGTTC 9600 
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GGGGAGTGGC TAACCCTCAG ATGCTGCATA TAAGCAGCTG CTTTCCGCTT GTACCGGGTC 966C 

TTAGTTAGAG GACCAGGTCT GAGCCCGGGA GCTCCCTGGC CTCTAGCTC5A ACCCGCTGCT 9720 

TAACGCTCAA TAAAGCTTGC CTTGAGTGAG AAGCAGTGTG TGCTCATCTG TTCAACCCTG 9780 

5 

GTGTCTAGAG ATC 9793 
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(i) SEQUENZ CHARAKTER I ST I KA : 

(A) LANGE: 1733 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Genotn-DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 57: 

AAACCTCCGA CGCAACGGGC TCGGCTTAGC GGAGTGCACC TGCTAAGAGG CGAGAGGAAC 60 

TCACAAGAGG GTGAGTAAAT TTGCTGGCGG TGGCCAGACC TAGGGGAAGG GCGAAGTCCC 120 

TAGGGGAGGA AGATGGGTGC GAGAGCGTCT GTGTTGACAG GGAGTAAATT GGATGCAT GG 180 

GAACGAATTA GGTTAAGGCC AGGATCTAAA AAGGCATATA GGCTAAAACA TTTAGTATGG 240 

GCAAGCAGGG AGCTGGAAAG ATACGCATGT AATCCTGGTC TATTAGAAAC TGCAGAAGGT 300 

ACTGAGCAAC TGCTACAGCA GTTAGAGCCA GCTCTCAAGA CAGGGTCAGA GGACCTGAAA 360 

TCTCTCTGGA ACGCAATAGC AGTACTCTGG TGCGTTCACA ACAGATTTGA CATCCGAGAT 420 

ACACAGCAGG CAATACAAAA GTTAAAGGAA GTAATGGCAA GCAGGAAGTC TGCAGAGGCC 480 

GCTAAGGAAG AAACAAGCCC TAGGCAGACA AGTCAAAATT ACCCTATAGT AACAAATGCA 540 

CAGGGACAAA TGGTACATCA AGCCATCTCC CCCAGGACTT TAAATGCATG GGTAAAGGCA 600 

GTAGAAGAGA AGGCCTTTAA CCCTGAAATT ATTCCTATGT TTATGGCATT ATCAGAAGGG- 660 

GCTGTCCCCT ATGATATCAA TACCATGCTG AATGCCATAG GGGGACACCA AGGGGCTTTA 720 

CAAGTGTTGA AGGAAGTAAT CAATGAGGAA GCAGCAGAAT GGGATAGAAC TCATCCACCA 780 

GCAAT GGGGC CGTTACCACC AGGGCAGATA AGGGAACCAA CAGGAAGTGA CATTGCTGGA 840 

ACAACTAGCA CACAGCAAGA GCAAATTATA TGGACTACTA GAGGGGCTAA CTCTATCCCA 900 

GTAGGAGACA TCTATAGAAA ATGGATAGTG CTAGGACTAA ACAAAATGGT AAAAATGTAC 960 

AGTCCAGTGA GCATCTTAGA TATTAGGCAG GGACCAAAAG AACCATTCAG AGATTATGTA 1020 

GATCGGTTTT ACAAAACATT AAGAGCTGAG CAAGCTACTC AAGAAGTAAA GAATTGGATG 1080 

ACAGAAACCT TGCTTGTTCA GAATTCAAAC CCAGATTGTA AACAAATTCT GAAAGCATTA 1140 

GGACCAGAAG CTACTTTAGA AGAAATGATG GTAGCCTGTC AAGGAGTAGG AGGGCCAACT 1200 

CACAAGGCAA AAATACTAGC AGAAGCAATG GCTTCTGCCC AGCAAGATTT AAAAGGAGGA 1260 

TACACAGCAG TATTCATGCA AAGAGGGCAG AATCCAAATA GAAAAGGGCC CATAAAATGC 1320 

TTCAATTGTG GAAAAGAGGG ACATATAGCA AAAAACTGTC GAGCACCTAG AAAAAGGGGT 1380 

TGCTGGAAAT GTGGACAGGA AGGTCACCAA ATGAAAGATT GCAAAAATGG AAGACAGGCA 1440 

AATTTTTTAG GG AAGTACTG GCCTCCGGGG GGCACGAGGC CAGGCAATTA TGTGCAGAAA 1500 

CAAGTGTCCC CATCAGCCCC ACCAATGGAG GAGGCAGTGA AGGAACAAGA GAATCAGAGT 1560 
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CAGAAGGGGG ATCAGGAAGA GCTGTACCCA TTTGCCTCCC TCAAATCCCT CTTTGGGACA 1620 
GACCAATAGT CACAGCAAAG GTTGGGGGTC ATCTATGTGA GGCTJTACTO GAlCACAGGGG 1680 
CAGATGATAC AGTATTAAAT AACATACAAT TAGAAGGAAG ATGGACACCA AAA' 1733 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1733 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Ein2el 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Genom-DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 58: 
AAACCTCCAA CGCAACGGGC TCGGCTTAGC GGAGTGCACC TGCTAAGAGG CGAGAGGAAC 
TCACAAGAGG GTGAGTAAAT TTGCTGGCGG TGGCCAGACC TAGGGGAAGG GCGAAGTCCC 
TAGGGGAGGA AGATGGGTGC GAGACGGTCT GTGTTGACAG GGAGTAAATT GGATGCATGG 
GAACGAATTA GGTTAAGGCC AGGATCTAAA AAGGCATATA GGCTAAAACA TTTAGTATGG 
GCAAGCAGGG AGCTGGAAAG ATACGCATAT AATCCTGGTC TACTAGAAAC TGCAGAAGGT 
ACTGAACAAC TGCTACAGCA GTTAGAGCCA GCTCTCAAGA CAGGGTCAGA GGACCTGAAA 
TCCCTCTGGA ACGCAATAGC AGTACTCTGG TGCGTTCACA ACAGATTTGA CATCCGAGAT 
ACACAGCAGG CAATACAAAA GTTAAAGGAA GTAATGGCAA GCAGGAAGTC TGCAGAGGCC 
GCTAAGGAAG AAACAAGCTC AAGGCAGGCA AGTCAAAATT ACCCTATAGT AACAAATGCA 
CAGGGACAAA TGGTACATCA AGCCATATCC CCTAGGACTT TAAATGCATG GGTAAAGGCA 
GTAGAAGAAA AGGCCTTTAA CCCTGAAATT ATTCCTATGT TTATGGCATT ATCAGAAGGG 
GCTGTCCCCT ATGATATCAA TACCATGCTG AATGCCATAG GGGGACACCA AGGGGCTTTA 
CAAGTGTTGA AGGAAGTAAT CAATGAGGAA GCAGCAGATT GGGATAGAAC T CAT CCA CCA 
GCAATGGGGC CGTTACCACC AGGGCAGATA AGGGAACCAA CAGGAAGTGA CATTGCTGGA 
ACAACTAGCA CACAGCAAGA GCAAATTATA TGGACTACTA GAGGGGCTAA CTCTATCCCA 
GTAGGAGACA TCTATAGAAA ATGGATAGTG TTAGGACTAA ACAAAATGGT AAAAATGTAC 
AGTCCAGTGA GCATCTTAGA TATTAGGCAG GGACCAAAAG AACCATTCAG AGATTATGTA 
GATCGGTTTT ACAAAACATT AAGAGCTGAG CAAGCTACTC AAGAAGTAAA GAATTGGATG 
ACAGAAACCC TCGTTGTTCA GAATTCAAAC CCAGATTGTA AACAAATTCT GAAAGCATTA 
GGACCAGGAG CTACTTTAGA AGAAATGATG GTAGCCTGTC AAGGAGTAGG AGGGCCAACT 
CACAAGGCAA AAATACTAGC AGAAGCAATG GCTTCTGCCC AGCAAGATTT AAAGGGAGGA 
TACACAGCAG TATTCATGCA AAGAGGGCAG AATCCAAATA GAAAAGGGCC TATAAAATGT 
TTCAATTGTG GAAAAGAGGG ACATATAGCA AAAAACTGTC GAGCACCTAG AAGAAGGGGT 
TACTGGAAAT GTGGACAGGA AGGTCACCAA ATGAAAGATT GCAAAAATGG AAGACAGGCT 
ATTTTTTTAG GGAAGTACTG GCCTCCGGGG GGCACGAGGC CAGCCAATTA TGTGCAGAAA 
CAAGTGTCCC CATCAGCCCC ACCAATGGAG GAGGCAGTGA AGGAACAAGA GAATCAGAAT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
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780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
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CAAAAGGGGG ATCAGGAAGA GCTGTACCCA TTTGCCTCCC TCAAATCCCT CTTTGGGACA 
GACCAATAGT CACAGCAAAG GTTGGGGGCC ATCTATGTGA GGCTTTACTG GATACAGGGG 
CAGATGATAC AGTATTAAAT AACATACAAT TAGAAGGAAG ATGGACACGC AAA 
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(2) INFORMATION ZU SEQ ID NO: 59: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 498 Aroinosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(v) ART DES FRAGMENTS : inneres 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 59: 

Met Gly Ala Arg Ala Ser Val Leu Thr Gly Ser Lys Leu Asp Ala Trp 
20 1 5 10 15 

Glu Arg lie Arg Leu Arg Pro Gly Ser Lys Lys Ala Tyr Arg Leu Lys 
20 25 30 

His Leu val Trp Ala Ser Arg Glu Leu Glu Arg Tyr Ala Cys Asn Pro 
35 40 45 

Gly Leu Leu Glu Thr Ala Glu Gly Thr Glu Gin Leu Leu Gin Gin Leu 
50 55 60 

Glu Pro Ala Leu Lys Thr Gly Ser Glu Asp Leu Lys Ser Leu Trp Asn 
65 70 75 80 

Ala He Ala Val Leu Trp Cys Val His Asn Arg Phe Asp He Arg Asp 
85 90 95 

Thr Gin Gin Ala He Gin Lys Leu Lys Glu Val Met Ala Ser Arg Lys 
100 105 HO 

Ser Ala Glu Ala Ala Lys Glu Glu Thr Ser Pro Arg Gin Thr Ser Gin 

120 125 
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Asn Tyr Pro He Val Thr Asn Ala Gin Gly Gin Met Val His Gin Ala 
130 135 140 

He Ser Pro Arg Thr Leu Asn Ala Trp val Lys Ala Val Glu Glu Lys 
145 150 155 160 

Ala Phe Asn Pro Glu He He Pro Met Phe Met Ala Leu Ser Glu Gly 
165 170 175 

45 Ala Val Pro Tyr Asp He Asn Thr Met Leu Asn Ala He Gly Gly His 

180 185 190 

Gin Gly Ala Leu Gin Val Leu Lys Glu Val He Asn Glu Glu Ala Ala 
1 200 205 



195 



Glu Trp Asp Arg Thr His Pro Pro Ala Met Gly Pro Leu Pro Pro Gly 

210 215 220 

Gin He Arg Glu Pro Thr Gly Ser Asp He Ala Gly Thr Thr Ser Thr 

225 230 235 240 

Gin Gin Glu Gin He He Trp Thr Thr Arg Gly Ala Asn Ser lie Pro 

55 245 250 255 

Val Gly Asp lie Tyr Arg Lys Trp lie Val Leu Gly Leu Asn Lys Met 
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Val Lys Met Tyr Ser Pro Val Ser lie Leu Asp lie Arg Gin Gly Pro 
275 280 285 

Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu Arg 
290 295 300 

Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr Glu Thr Leu 
305 310 315 320 

Leu Val Gin Asn Ser Asn Pro Asp Cys Lys Gin lie Leu Lys Ala Leu 

325 330 335 

Gly Pro Glu Ala Thr Leu Glu Glu Met Met Val Ala Cys Gin Gly Val 
340 345 350 

Gly Gly Pro Thr His Lys Ala Lys lie Leu Ala Glu Ala Met Ala Ser 
355 360 365 

Ala Gin Gin Asp Leu Lys Gly Gly Tyr Thr Ala Val Phe Met Gin Arg 
20 370 375 380 

Gly Gin Asn Pro Asn Arg Lys Gly Pro lie Lys Cys Phe Asn Cys Gly 
385 390 395 400 

2 5 Lys Glu Gly His lie Ala Lys Asn Cys Arg Ala Pro Arg Lys Arg Gly 

405 410 415 

Cys Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn 
420 425 430 

30 

Gly Arg Gin Ala Asn Phe Leu Gly Lys Tyr Trp Pro Pro Gly Gly Thr 
435 440 445 

Arg Pro Gly Asn Tyr Val Gin Lys Gin Val Ser Pro Ser Ala Pro Pro 
450 455 460 

35 

Met Glu Glu Ala Val Lys Glu Gin Glu Asn Gin Ser Gin Lys Gly Asp 
465 470 475 480 

Gin Glu Glu Leu Tyr Pro Phe Ala Ser Leu Lys Ser Leu Phe Gly Thr 
40 485 490 495 

Asp Gin 
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(2) INFORMATION ZU SEQ ID NO: 60: 

(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 498 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtiLS: Protein 

(v) ART DES FRAGMENTS: inneres 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 60: 

Met Gly Ala Arg Arg Ser Val Leu Thr Gly Ser Lys Leu Asp Ala Trp 
15 10 15 

Glu Arg He Arg Leu Arg Pro Gly Ser Lys Lys Ala Tyr Arg Leu Lys 
'5 20 25 30 

His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Tyr Ala Tyr Asn Pro 
35 40 45 



70 
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Gly Leu Leu Glu Thr Ala Glu Gly Thr Glu Gin Leu Leu Gin Gin Leu 
50 55 60 

Glu Pro Ala Leu Lys Thr Gly Ser Glu Asp Leu Lys Ser Leu Trp Asn 
65 70 75 80 

Ala He Ala Val Leu Trp Cys Val His Asn Arg Phe Asp He Arg Asp 
85 90 95 

Thr Gin Gin Ala He Gin Lys Leu Lys Glu Val Met Ala Ser Arg Lys 
100 105 110 

Ser Ala Glu Ala Ala Lys Glu Glu Thr Ser Ser Thr Gin Ala Ser Gin 
115 120 125 

Asn Tyr Pro He Val Thr Asn Ala Gin Gly Gin Met Val His Gin Ala 
130 135 140 

He Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Ala Val Glu Glu Lys 
145 150 155 160 

Ala Phe Asn Pro Glu He He Pro Met Phe Met Ala Leu Ser Glu Gly 
165 170 175 

Ala Val Pro Tyr Asp He Asn Thr Met Leu Asn Ala He Gly Gly His 
180 185 190 

Gin Gly Ala Leu Gin Val Leu Lys Glu Val He Asn Glu Glu Ala Ala 
195 200 205 

Asp Trp Asp Arg Thr His Pro Pro Ala Met Gly Pro Leu Pro Pro Gly 
210 215 220 

45 Gin He Arg Glu Pro Thr Gly Ser Asp He Ala Gly Thr Thr Ser Thr 

225 230 235 240 

Gin Gin Glu Gin He He Trp Thr Thr Arg Gly Ala Asn Ser He Pro 
245 250 255 
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Val Gly Asp He Tyr Arg Lys Trp He Val Leu Gly Leu Asn Lys Met 
260 265 270 
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Val Lys Met Tyr Ser Pro Val Ser lie Leu Asp lie Arg Gin Gly Pro 
275 280 285 

s Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Lea Arg 
290 295 300 

Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr Glu Thr Leu 
305 310 315 320 

10 

Val Val Gin Asn Ser Asn Pro Asp Cys Lys Gin lie Leu Lys Ala Leu 

325 330 335 

Gly Pro Gly Ala Thr Leu Glu Glu Met Met Val Ala Cys Gin Gly Val 
75 340 345 350 

Gly Gly Pro Thr His Lys Ala Lys lie Leu Ala Glu Ala Met Ala Ser 
355 360 365 

Ala Gin Gin Asp Leu Lys Gly Gly Tyr Thr Ala Val Phe Met Gin Arg 
20 370 375 380 

Gly Gin Asn Pro Asn Arg Lys Gly Pro lie Lys Cys Phe Asn Cys Gly 
385 390 395 400 

25 Lys Glu Gly His lie Ala Lys Asn Cys Arg Ala Pro Arg Arg Arg Gly 

405 410 415 

Tyr Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn 
420 425 430 

30 

Gly Arg Gin Ala Asn Phe Leu Gly Lys Tyr Trp Pro Pro Gly Gly Thr 
435 440 445 

Arg Pro Ala Asn Tyr Val Gin Lys Gin Val Ser Pro Ser Ala Pro Pro 
35 450 455 460 

j 

Met Glu Glu Ala Val Lys Glu Gin Glu Asn Gin Asn Gin Lys Gly Asp 
465 470 475 480 

Gin Glu Glu Leu Tyr Pro Phe Ala Ser Leu Lys Ser Leu Phe Gly Thr 
^ 485 490 495 

Asp Gin 

45 

PatentansprUche 

1. Immunschwache-Virus der HIV-Gruppe Oder Varianten dieses Virus, das die wesentlichen morphologi- 
schen und immunologischen Eigenschaften des bei der European Collection of Animal Cell Cultures 

so (ECACC) unter der Nr. V 920 92 318 hinterlegten Retrovirus mit der Bezeichnung MVP-51 80/91 
aufweist. 

2. Immunschwache-Virus nach Anspruch 1 , dadurch gekennzeichnet, daB es eine der Reversen Transkrip- 
tase entsprechende Proteinbande im Western Blot aufweist, die 3-7 Kilodalton kleiner ist als die 

55 entsprechende Bande der Viren HIV-1 und/oder HIV-2. 

3. ImmunschwMche-Virus nach einem der Anspruche 1 Oder 2, dadurch gekennzeichnet, daB dieses 
Retrovirus mit einem gegen das Protein p 24 gerichteten monoklonalen Antikorper weniger Reaktivitat 
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aufweist, bezogen auf die Reverse Transkriptase-Aktivitat, als das Virus HIV-1 und mehr Aktivitat, 
bezogen auf die Aktivitat der Reversen Transkriptase, als HIV-2. 

4. Immunschwache-Virus nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, daB mit 
5 seinem Transmembranprotein gp 41 Antigen-Antikorperreaktionen gut nachweisbar sind mit Seren von 

aus Afrika stammenden Patienten und, daB mit dem gp 41 nur eine geringere oder keine Antigen- 
Antikorperreaktion mit Seren von aus Deutschland stammenden Patienten nachgewiesen werden kann. 

5. Immunschwache-Virus nach einem der obengenannten Anspruche, dadurch gekennzeichnet, daB es 
10 eine RNA-Sequenz aufweist, die mit der RNA des hinterlegten Virus zu etwa 75 % oder mehr, bezogen 

auf das Gesamtgenom, homolog ist. 

6. Immunschwache-Virus nach einem der oben genannten AnsprUche, dadurch gekennzeichnet, daB es 
eine RNA-Sequenz aufweist, die zu der RNA-Sequenz von Tabelle 1 zu wenigstens 75 % homolog ist. 

75 

7. Immunschwache-Virus nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, daB es eine 
Nucleotid-Sequenz aufweist, die zu der Sequenz von Tabelle 3 oder Teilen davon zu wenigstens 75 % 
homolog ist. 

20 8. Immunschwache-Virus nach Anspruch 7, dadurch gekennzeichnet, daB der Teil der Sequenz wenig- 
stens 50 Nucleotide lang ist. 

9. Immunschwache-Virus nach einem der vorhergehenden AnsprUche, dadurch gekennzeichnet, daB es 
eine Sequenz oder Teilsequenz aufweist, die der Fig. 4 entspricht oder zu dieser Sequenz homolog ist, 

25 wobei die Unterschiede zu der in Fig. 4 angegebenen Sequenz bezogen auf die Genorte hochstens 
betragen: LTR: 17 %, GAG: 29 %; POL: 25 %; VIF: 31 %; ENV: 46 %; NEF: 16 %. 

10. Immunschwache-Virus nach einem der vorhergehenden AnsprUche, dadurch gekennzeichnet, daB es 
eine Sequenz oder Teilsequenz aufweist, die der Fig. 4 entspricht oder zu dieser Sequenz homolog ist, 

30 wobei die Unterschiede zu der in Fig. 4 angegebenen Sequenz bezogen auf die Genorte hochstens 
betragen: LTR: 10 %; GAG: 14 %; POL: 12 %; VIF: 15 %; ENV: 22 %; NEF: 10 %. 

11. cDNA, die komplementar ist zu der RNA oder Teilen davon, des bei der European Collection of Animal 
Cell Cultures (ECACC) unter der Nr. V 920 92 318 hinterlegten Immunschwache-Virus MVP-51 80/91 

35 oder eines Virus gemaB einem der AnsprUche 1-10. 

12. Rekombinante DNA, dadurch gekennzeichnet, daB sie cDNA gemaB Anspruch 11 enthalt. 

13. Antigen, das unter Verwendung der cDNA gemaB Anspruch 11 oder der rekombinanten DNA gemaB 
40 Anspruch 12 hergestellt wurde oder unter Verwendung der Aminosaurenstruktur, die aus seiner cDNA 

abgeleitet werden kann. 

14. Antigen nach Anspruch 13, dadurch gekennzeichnet, daB es ein Protein oder Peptid ist. 

45 15. Antigen nach einem der AnsprUche 13 oder 14, dadurch gekennzeichnet, daB es eine Aminosaurese- 
quenz aufweist, die der Tabelle 3 oder einer Teilsequenz davon entspricht. 

16. Antigen nach Anspruch 15, dadurch gekennzeichnet, daB die Teilsequenz wenigstens 10 Aminosauren 
aufweist. 

50 

17. Antigen nach Anspruch 15, dadurch gekennzeichnet, daB es die Aminosauresequenz RLQALET- 
LIQNQQRLNLWGCKGKLICYTSVKWNTS oder eine Teilsequenz davon mit wenigstens 6 aufeinanderfol- 
genden Aminossiuren aufweist. 

55 18. Antigen, das aus einem Immunschwache-Virus gemaB einem der AnsprUche 1 bis 10 hergestellt wurde. 

19. Antigen nach einem der AnsprUche 13 bis 18, dadurch gekennzeichnet, daB es rekombinant hergestellt 
wurde. 

54 
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20. Antigen nach einem der AnsprOche 13 bis 17, dadurch gekennzeichnet, daB es synthetisch heraestellt 
wurde. 

21. Testkit zum Nachweis von Antikorpern gegen Immunschwache verursachende Viren, dadurch gekenn- 
5 zeichnet, daB Antigen gemaB den AnsprOchen 13 bis 20 eingesetzt wird. 

22. Testkit gemaB Anspruch 21, dadurch gekennzeichnet, daB es ein Western Blot ist. 

2a Testkit gemaB Anspruch 21, dadurch gekennzeichnet, daB es ein ELISA-Test ist oder ein Fluoreszenz- 
10 Antikorper Nachweistest ist. 

24. Verwendung des Immunschwache-Virus gemaB einem der AnsprOche 1 bis 10 und/oder der cDNA 
gemaB Anspruch 11 oder 12 und/oder eines Antigens gemaB den AnsprGchen 13 bis 20 zum Nachweis 
von Retroviren, die Immunschwache verursachen. 



15 



25. Verwendung eines Retrovirus nach einem der AnsprOche 1 bis 10, einer cDNA gemaB Anspruch 11 
oder 12 und/oder eines Antigens gemaB den Anspruchen 13 bis 20 zur Herstellung von Impfstoffen. 

26. RibonukleinsMure, dadurch gekennzeichnet, daB sie fOr ein Immunschwache-Virus nach einem der 
20 AnsprOche 1 bis 10 kodiert. 



25 



30 



35 



40 



45 



SO 
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Fig. 4: Sequenz von MvP 5180 (Sequ. ID No. 56) 



1 


CTGGATGGGT 


TAATTTACTC 


CCATAAGAGA 


GCAGAAATCC 


TGGATCTCTG 


51 


GATATATCAC 


ACTCAGGGAT 


TCTTCCCTGA 


TTGGCAGTGT 


TACACACCGG 


101 


GACCAGGACC 


TAGATTCCCA 


CTGACATTTG 


GATGGTTGTT 


TAAACTGGTA 


151 


CCAGTGTCAG 


CAGAAGAGGC 


AGAGAGACTG 


GGTAATACAA 


ATGAAGATGC 


201 


TAGTCTTCTA 


CATCCAGCTT 


GTAATCATGG 


A GCTGAGG AT 


GCACACGGGG 


251 


AGATACTAAA 


ATGGCAGTTT 


GATAGATCAT 


TAGGCTTAAC 


ACATATAGCC 


301 


CTGCAAAAGC 


ACCCAGAGCT 


CTTCCCCAAG 


TAACTGACAC 


TGCGGGACTT 


351 


TCCAGACTGC 


TGACACTGCG 


GGGACTTTCC 


AGCGTGGGAG 


GGATAAGGGG 


401 


CGGTTCGGGG 


AGTGGCTAAC 


CCTCAGATGC 


TGCATATAAG 


CAGCTGCTTT 


451 


CCGCTTGTAC 


CGGGTCTTAG 


TTA GAGGACC 


AGGTCTGAGC 


CCGGGAGCTC 


501 


CCTGGCCTCT 


AGCTGAACCC 


GCTGCTTAAC 


GCTCAATAAA 


GCTTGCCTTG 


551 


AGTGAGAAGC 


AGTGTGTGCT 


CATCTGTTCA 


ACCCTGGTGT 


CTAGAGATCC 


601 


CTCAGATCAC 


TTAGACTGAA 


GCAGAAAATC 


TCTAGCAGTG 


GCGCCCGAAC 


651 


AGGGACGCGA 


AAGTGAAAGT 


GGAACCAGGG 


AAGAAAACCT 


CCGACGCAAC 


701 


GGGCTCGGCT 


TAGCGGAGTG 


CACCTGCTAA 


GAGGCGAGAG 


GAACTCACAA 


751 


GAGGGTGAGT 


AAATTTGCTG 


GCGGTGGCCA 


GACCTAGGGG 


AAGGGCGAAG 


801 


TCCCTAGGGG 


AGGAAGATGG 


GTGCGAGAGC 


GTCTGTGTTG 


ACAGGGAGTA 


p m 
□ Ji 


J\J\ i. -L kj\jx\ X w v_ 




ATTAGGTTAA 


GGCCAGGATC 


TAAAAAGGCA 


901 


TATAGGCTAA 


AACATTTAGT 


ATGGGCAAGC 


AGGGAGCTGG 


AAAGATACGC 


951 


ATGTAATCCT 


GGTCTATTAG 


AAACTGCAGA 


AGGTACTGAG 


CAACTGCTAC 


1001 


AGCAGTTAGA 


GCCAGCTCTC 


AAGACAGGGT 


CAGAGGACCT 


GAAATCTCTC 


1051 


TGGAACGCAA 


TAGCAGTACT 


CTGGTGCGTT 


CACAACAGAT 


TTGACATCCG 


1101 


AGATACACAG 


CAGGCAATAC 


AAAAGTTAAA 


GGAAGTAATG 


GCAAGCAGGA 


1151 


AGTCTGCAGA 


GGCCGCTAAG 


GAAGAAACAA 


GCCCTAGGCA 


GACAAGTCAA 


1201 


AATTACCCTA 


TAGTAACAAA 


TGCACAGGGA 


CAAATGGTAC 


ATCAAGCCAT 
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1Z Jl 


L, J. LLLLLnuO 


x\k~ X X X>rV/VrlX O 


rATfiGGTAAA 


GGCAGTAGAA 


GAGAAGGCCT 


1 Jul 


TT A ACCCTCZA 


AATTATTPCT 


ATGTTTATGG 


CATTATCAGA 


AGGGGCTGTC 


1 OCI 

1 j j1 


C HHT A T fJA T A 


X k^XVTl X A \— LiA X 


GCTGAATGCC 


ATAGGGGGAC 


ACCAAGGGGC 


i /ini 
14U1 


1 1 IALaaoI w 


ttpsa AnnA An 


TAATPAATGA 


GGAAGCAGCA 


GAATGGGATA 


14 j1 


LjAA I— x L~A J. C c 


arfAnrAATn 

nLLnuL/in X O 




CACCAGGGCA 


GATAAGGGAA 


1501 


CCAAL-AuCjAA 


ij 1 LjAV- A X x IjC 


TnnA ar a apt 




AAGAGC1AAAT 


1551 


TATATGGACT 


ACTAGAGGGG 


L1AALIL1A1 


rrr'AfiT Ann A 


CZ APATP? ATA 


1601 


GAAAATGGAT 


AGTGCTAGGA 


C TAAALAAAA 


rn/-» /-*rn A A A A AT 

X bblAAAAAl 


u 1 ALAb X \~ Un 


1651 


GTGAGCATCT 


TAGATATTAG 


GCAGGGACCA 


AAAbAAL L.A x 


TPS P.&P-A fPTB. 
x LAunbAi X A 


1701 


TGTAGATCGG 


TTTTACAAAA 


CATTAAGAGC 


1 CaAbLAAULl 


A /rpr* A A r* A A /T, 

AC 1 L-AAVjAALj 


1751 


TAAAGAATTG 


GATGACAGAA 


ACCTTGCTTG 


ntmn a p A A iPTP 

TTCAGAA1 1 C 


A A APPPAPAT 

AAALLLAbAl 


1801 


TGTAAACAAA 


TTCTGAAAGC 


ATTAGGACCA 


bAAbLIALl 1 


lAuAAbAAAl 


1851 


GATGGTAGCC 


TGTCAAGGAG 


TAGGAGGGCC 


AAL 1 UAUAAb 


pp & Mi a a tap 

bUiAAAAlAL 


1901 


TAGCAGAAGC 


AATGGCTTCT 


GCCCAGCAAG 


Tk mmm ii a a a t~* 

ATTTAAAAGG 


APPATAPAPA 

AuuAIAlALA 


1951 


GCAGTATTCA 


TGCAAAGAGG 


GCAGAATCCA 


AATAGAAAAG 


GGCCCATAAA 


2001 


ATGCTTCAAT 


TGTGGAAAAG 


AGGGACATAT 


AGCAAAAAAC 


TGTCGAGCAC 


2051 


CTAGAAAAAG 


GGGTTGCTGG 


AAATGTGGAC 


AGGAAGGTCA 


^ t A a m Tk n n 

CCAAATGAAA 


2101 


GATTGCAAAA 


ATGGAAGACA 


GGCAAATTTT 


TTAGGGAAGT 


m m s** ^"i y^ y^i 

ACTGGCCTCC 


2151 


GGGGGGCACG 


AGGCCAGGCA 


ATTATGTGCA 


G AAACAAGT G 


TCCCCATCAG 


2201 


CCCCACCAAT 


GGAGGAGGCA 


GTGAAGGAAC 


AAGAGAATCA 


GAGTCAGAAG 


2251 


GGGGATCAGG 


AAGAGCT GTA 


CCCATTTGCC 


TCCCTCAAAT 


CCCTCTTTGG 


2301 


GACAGACCAA 


TAGTCACAGC 


AAAGGTTGGG 


GGTCATCTAT 


GTGAGGCTTT 


2351 


ACTGGATACA 


GGGGCAGATG 


ATACAGTATT 


AAATAACATA 


CAATTAGAAG 


2401 


GAAGATGGAC 


ACCAAAAATG 


ATAGGGGGTA 


TAGGAGGCTT 


TATAAAAGTA 


2451 


AAAGAGTATA 


ACAATGTGAC 


AGTAGAAGTA 


CAAGGAAAGG 


AAGTACAGGG 


2501 


AACAGTATTG 


GTGGGACCTA 


CTCCTGTTAA 


TATTCTTGGG 


AGAAACATAT 


2551 


TGACAGGATT 


AGGATGTACA 


CTAAATTTCC 


CTATAAGTCC 


CATAGCCCCA 
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2601 GTGCCAGTAA AGCTAAAACC AGGAATGGAT GGACCAAAAG TAAAACAATG 
2651 GCCCCTATCT AGAGAGAAAA TAGAAGCACT AACTGCAATA TGTCAAGAAA 
2701 TGGAACAGGA AGGAAAAATC TCAAGAATAG GACCTGAAAA TCCTTATAAT 
2 751 ACACCTATTT TTGCTATAAA AAAGAAAGAT AGCACTAAGT GGAGAAAATT 
2801 GGTAGACTTC AGAGAATTAA ATAAAAGAAC ACAAGATTTC TGGGAGGTGC 
2851 AATTAGGTAT TCCACATCCA GGGGGTTTAA AGCAAAGGCA ATCTGTTACA 
2901 GTCTTAGATG TAGGAGATGC TTATTTCTCA TGCCCTTTAG ATCCAGACTT 
2951 TAGAAAATAC ACTGCCTTCA CTATTCCTAG TGTGAACAAT GAGACCCCAG 
3001 GAGTAAGATA CCAGTACAAT GTCCTCCCGC AAGGGTGGAA AGGTTCACCA 
30 51 GCCATATTTC AGAGTTCAAT GACAAAGATT CTAGATCCAT TTAGAAAAAG 
3101 CAACCCAGAA GTAGAAATTT ATCAGTACAT AGATGACTTA TATGTAGGAT 
3151 CAGATTTACC ATTGGCAGAA CATAGAAAGA GGGTCGAATT GCTTAGGGAA 
3 201 CATTTATATC AGTGGGGATT TACTACCCCT GATAAAAAGC ATCAGAAGGA 
3251 ACCTCCCTTT TTATGGATGG GATATGAGCT CCACCCAGAC AAGTGGACAG 
3 301 TACAGCCCAT CCAATTGCCT GACAAAGAAG TGTGGACAGT AAATGATATA 
3351 CAAAAATTAG TAGGAAAATT AAATTGGGCA AGTCAAATCT ATCAAGGAAT 
3401 TAGAGTAAAA GAATTGTGCA AGTTAATCAG AGGAACCAAA TCATTGACAG 

34 51 AGGTAGTACC TTTAAGTAAA GAGGCAGAAC TAGAATTAGA AGAAAACAGA 
3501 GAAAAGCTAA AAGAGCCAGT ACATGGAGTA TATTACCAGC CTGACAAAGA 

35 51 CTTGTGGGTT AGTATTCAGA AGCATGGAGA AGGGCAATGG ACTTACCAGG 
3601 T ATAT CAGGA TGAACATAAG AACCTTAAAA CAGGAAAATA TGCTAGGCAA 
3651 AAGGCCTCCC ACACAAATGA TATAAGACAA TTGGCAGAAG TAGTCCAGAA 
3701 GGTGTCTCAA GAAGCTATAG TTATATGGGG GAAATTACCT AAATTCAGGC 
3751 TGCCAGTTAC TAGAGAAACT TGGGAAACTT GGTGGGCAGA ATATTGGCAG 
3801 GCCACCTGGA TTCCTGAATG GGAATTTGTC AGCACACCCC CATTGATCAA 
3851 ATTATGGTAC CAGTTAGAAA CAGAACCTAT TGTAGGGGCA GAAACCTTTT 
3901 ATGTAGATGG AGCAGCTAAT AGGAATACAA AACTAGGAAA GGCGGGATAT 
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3951 


/"•mm* ^ A /"^ A A C 


A Af^nAAAACA 


4001 


m^"*TV TV TV A^Of* ,r P 


Cl A A TT A ATfrfr 


4051 


AGCAAGTAAA 


r* A T* A flT A A P A 


4101 


TCCCAACCAA 


L.AL.AvjA\j J. vjM 


4151 


ACTAACAAAA 


a a nn a APf?An 

AA vJ w AA V- Vj rl VJ 


4201 


GCATAGGAGG 


AAATHAAAAA 


4251 


AGAGTCCTGT 




4301 


ATATCATAGT 


AA1 IVjLjAtjAVj 


4351 


TAGTAGCCAA 


GGAAA1LAJ. X 


4401 


GAAGCAACGC 


ATGGTCAAGT 


4451 


TTGTACACAT 


TTAGAAGGCA 


4501 


GTGACTTTAT 


AGAAGCAGAG 


4551 


GCCTATTTCC 


TGTTAAAATT 


4601 


TACAGACAAT 


GGACCTAATT 


4651 


GGTGGACAGG 


CATACAACAT 


4701 


CAAGGAGTAG 


TAGAAGCCAT 


4751 


GGTGAGGGAC 


CAAGCAGAGC 


4801 


TTGTTCACAA 


TTTTAAAAGA 


4851 


GAGAGACTAA 


TAGACATACT 


4901 


AAAACAAATT 


TTAAAAATCA 


4951 


GAGACCCTAT 


TTGGAAAGGA 


5001 


GCAGTAGTCA 


TACAAGATAA 


5051 


GGCAAAAATA 


ATCAGAGATT 


5101 


TGGCAAATAG 


ACAGACAGAA 


5151 


CCATAAATAC 


ATGTCTAAGA 


5201 


ATGAATCCAG 


GAATCCAAAA 


5251 


GAAGCTGATA 


TAGTGGTCAC 



GAACATAATA AAGTTAGAAG AGACAACCAA 
CTGTATTAAT AGCCTTGCAG GATTCCAAGG 
GACTCACAAT ATGTATTGGG CATCATATCC 
CTCCCCTATA GTTCAGCAGA TAATAGAGGA 
TGTATCTTAC ATGGGTTCCT GCTCACAAAG 
ATAGATAAAT TAGTAAGCAA AGACATTAGA 
AATAGATCAG GCACAAGAAG ATCATGAAAA 
CATTAGCTAG TGACTTTGGA TTACCACCAA 
GCTAGTTGTC CTAAATGCCA TATAAAAGGG 
AGACTACAGC CCA GAGA TAT GGCAAATGGA 
AAATCATAAT AGTTGCTGTC CATGTAGCAA 
GTGATACCAG CAGAAACAGG ACAGGAAACT 
AGCAGCAAGA TGGCCTGTCA AAGTAATACA 
TTACAAGTGC AGCCATGAAA GCTGCATGTT 
GAGTTTGGGA TACCATATAA TCCACAAAGT 
GAATAAAGAA TTAAAATCTA TTATACAGCA 
ATTTAAAAAC AGCAGTACAA ATGGCAGTCT 
AAAGGGGGGA TTGGGGGGTA CACTGCAGGG 
AGCATCACAA ATACAAACAA CAGAACTACA 
ACAATTTTCG GGTCTATTAC AGAGATAGCA 
CCGGCACAAC TCCTGTGGAA AGGTGAGGGG 
AGGAGACATT AAAGTGGTAC CAAGAAGAAA 
ATGGAAAACA GATGGCAGGT ACTGATAGTA 
AGTGAAAGCA TGGAACAGCC TGGTGAAATA 
AGGCCGCGAA CTGGCGTTAT AGGCATCATT 
GTCAGTTCGG CGGTGTATAT TCCAGTAGCA 
CACATATTGG GGATTAATGC CAGGGGAAAG 
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5301 AGAGGAACAC TTGGGACATG GGGTTAGTAT AGAATGGCAA TACAAGGAGT 
5351 ATAAAACACA GATTGATCCT GAAACAGCAG ACAGGATGAT ACATCTGCAT 
5401 TATTTCACAT GTTTTACAGA ATCAGCAATC AGGAAGGCCA TTCTAGGGCA 
54 51 GAGAGTGCTG ACCAAGTGTG AATACCTGGC AGGACATAGT CAGGTAGGGA 
5 501 CACTACAATT CTTAGCCTTG AAAGCAGTAG TGAAAGTAAA AAGAAATAAG 
5 551 CCTCCCCTAC CCAGTGTCCA GAGATTAACA GAAGATAGAT GGAACAAGCC 
5601 CTGGAAAATC AGGGACCAGC TAGGGAGCCA TTCAATGAAT GGACACTAGA 
5 651 GCTCCTGGAA GAGCTGAAAG AAGAAGCAGT AAGACATTTC CCTAGGCCTT 
5 701 GGTTACAAGC CTGTGGGCAG TACATTTATG AGACTTATGG AGACACTTGG 
5751 GAAGGAGTTA TGGCAATTAT AAGAATCTTA CAACAACTAC TGTTTACCCA 
5801 TTATAGAATT GGATGCCAAC ATAGTAGAAT AGGAATTCTC CCATCTAACA 
5851 CAAGAGGAAG AGGAAGAAGA AATGGATCCA GTAGATCCTG AGATGCCCCC 
5901 TTGGCATCAC CCTGGGAGCA AGCCCCAAAC CCCTTGTAAT AATTGCTATT 
5951 GCAAAAGATG CTGCTATCAT TGCTATGTTT GTTTCACAAA GAAGGGTTTG 
6001 GGAATCTCCC ATGGCAGGAA GAAGCGAAGA AGACCAGCAG CTGCTGCAAG 
6051 C TAT CCA GAT AATAAAGATC CTGTACCAGA GCAGTAAGTA ACGCTGATGC 
6101 ATCAAGAGAA CCTGCTAGCC TTAATAGCTT TAAGTGCTTT GTGTCTTATA 
6151 AATGTACTTA TATGGTTGTT TAACCTTAGA ATTTATTTAG TGCAAAGAAA 
6201 ACAAGATAGA AGGGAGCAGG AAATACTTGA AAGATTAAGG AGAATAAAGG 
6251 AAATCAGGGA TGACAGTGAC TATGAAAGTA ATGAAGAAGA ACAACAGGAA 
6301 GTCATGGAGC TTATACATAG CCATGGCTTT GCTAATCCCA TGTTTGAGTT 
63 51 ATAGTAAACA ATTGTATGCC ACAGTTTATT CTGGGGTACC TGTATGGGAA 
6401 GAGGCAGCAC CAGTACTATT CTGTGCTTCA GATGCTAACC TAACAAGCAC 
6451 TGAACAGCAT AATATTTGGG CATCACAAGC CTGCGTTCCT ACAGATCCCA 
6 501 ATCCACATGA ATTTCCACTA GGCAATGTGA CAGATAACTT TGATATATGG 
65 51 AAAAATTACA TGGTGGACCA AATGCATGAA GACATCATTA GTTTGTGGGA 
6601 ACAGAGTTTA AAGCCTTGTG AGAAAATGAC TTTCTTATGT GTACAAATGA 
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6651 ACTGTGTAGA TCTGCAAACA AATAAAACAG GCCTATTAAA TGAGACAATA 
6701 AATGAGATGA GAAATTGTAG TTTTAATGTA ACTACAGTCC TCACAGACAA 
6751 AAAGGAGCAA AAACAGGCTC TATTCTATGT ATCAGATCTG AGTAAGGTTA 
6801 ATGACTCAAA TGCAGTAAAT GGAACAACAT ATATGTTAAC TAATTGTAAC 
6851 TCCACAATTA TCAAGCAGGC CTGTCCGAAG GTAAGTTTTG AGCCCATTCC 
6901 CATACACTAT TGTGCTCCAA CAGGATATGC CATCTTTAAG TGTAATGACA 
6951 CAGACTTTAA TGGAACAGGC CTATGCCACA ATATTTCAGT GGTTACTTGT 
7001 ACACATGGCA TCAAGCCAAC AGTAAGTACT CAACTAATAC TGAATGGGAC 
7051 ACTCTCTAGA GAAAAGATAA GAATTATGGG AAAAAATATT ACAGAATCAG 
7101 CAAAGAATAT CATAGTAACC CTAAACACTC CTATAAACAT GACCTGCATA 
7151 AGAGAAGGAA TTGCAGAGGT ACAAGATATA TATACAGGTC CAATGAGATG 
7201 GCGCAGTATG ACACTTAAAA GAAGTAACAA TACATCACCA AGATCAAGGG 
7251 TAGCTTATTG TACATATAAT AAGACTGTAT GGGAAAATGC CCTACAACAA 
7301 ACAGCTATAA GGTATTTAAA TCTTGTAAAC CAAACAGAGA ATGTTACCAT 
7351 AATATTCAGC AGAACTAGTG GTGGAGATGC AGAAGTAAGC CATTTACATT 
7401 TTAACTGTCA TGGAGAATTC TTTTATTGTA ACACATCTGG GATGTTTAAC 
7451 TATACTTTTA TCAACTGTAC AAAGTCCGGA TGCCAGGAGA TCAAAGGGAG 
7501 CAATGAGACC AATAAAAATG GTACTATACC TTGCAAGTTA AGACAGCTAG 
7551 TAAGATCATG GATGAAGGGA GAGTCGAGAA TCTATGCACC TCCCATCCCC 
7601 GGCAACTTAA CATGTCATTC CAACATAACT GGAATGATTC TACAGTTAGA 
7651 TCAACCATGG AATTCCACAG GTGAAAATAC ACTTAGACCA GTAGGGGGAG 
7701 ATATGAAAGA TATATGGAGA ACTAAATTGT ACAACTACAA AGTAGTACAG 
7751 ATAAAACCTT TTAGTGTAGC ACCTACAAAA ATGTCAAGAC CAATAATAAA 
7801 CATTCACACC CCTCACAGGG AAAAAAGAGC AGTAGGATTG GGAATGCTAT 
7851 TCTTGGGGGT GCTAAGTGCA GCAGGTAGCA CTATGGGCGC AGCGGCAACA 
7901 GCGCTGACGG TACGGACCCA CAGTGTACTG AAGGGTATAG TGCAACAGCA 
7951 G GACAACCT G CTGAGAGCGA TACAGGCCCA GCAACACTTG CTGAGGTTAT 
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8001 


CTGTATGGGG 


TATTAGACAA 


CTCCGAGCTC 


GCCTGCAAGC 


CTTAGAAACC 


8051 


CTTATACAGA 


ATCAGCAACG 


CCTAAACCTA 


TGGGGCTGTA 


AAGGAAAACT 


8101 


AATCTGTTAC 


ACATCAGTAA 


AATGGAACAC 


ATCATGGTCA 


GGAAGATATA 


8151 


ATGATGACAG 


TATTTGGGAC 


AACCTTACAT 


GGCAGCAATG 


GGACCAACAC 


8201 


ATAAACAATG 


TAAGCTCCAT 


TATATATGAT 


GAAATACAAG 


CAGCACAAGA 


8251 


CCAACAGGAA 


AAGAATGTAA 


AAGCATTGTT 


GGAGCTAGAT 


GAATGGGCCT 


8301 


CTCTTTGGAA 


TTGGTTTGAC 


ATAACTAAAT 


GGTTGTGGTA 


TATAAAAATA 


8351 


GCTATAATCA 


TAGTGGGAGC 


ACTAATAGGT 


ATAAGAGTTA 


TTATGATAAT 


8401 


ACTTAATCTA 


GTGAAGAACA 


TTAGGCAGGG 


ATATCAACCC 


CTCTCGTTGC 


8451 


AGATCCCTGT 


CCCACACCGG 


CAGGAAGCAG 


AAACGCCAGG 


AAGAACAGGA 


8501 


GAAGAAGGTG 


GAGAAGGAGA 


CAGGCCCAAG 


TGGACAGCCT 


TGCCACCAGG 


8551 


ATTCTTGCAA 


CAGTTGTACA 


CGGATCTCAG 


GACAATAATC 


TTGTGGACTT 


8601 


ACCACCTCTT 


GAGCAACTTA 


ATATCAGGGA 


TCCGGAGGCT 


GATCGACTAC 


8651 


CTGGGACTGG 


GACTGTGGAT 


CCTGGGACAA 


AAGACAATTG 


AAGCTTGTAG 


8701 


ACTTTGTGGA 


GCTGTAATGC 


AATATTGGCT 


ACAAGAATTG 


AAAAATAGTG 


8751 


CTACAAACCT 


GCTTGATACT 


ATTGCAGTGT 


CAGTTGCCAA 


TTGGACTGAC 


8801 


GGCATCATCT 


TAGGTCTACA 


AAGAATAGGA 


CAAGGATTCC 


TTCACATCCC 


8851 


AAGAAGAATT 


AGACAAGGTG 


CAGAAAGAAT 


CTTAGTGTAA 


CATGGGGAAT 


8901 


GCATGGAGCA 


AAAGCAAATT 


TGCAGGATGG 


TCAGAAGTAA 


GAGATAGAAT 


8951 


GAGACGATCC 


TCCTCTGATC 


CTCAACAACC 


ATGTGCACCT 


GGAGTAGGAG 


9001 


CTGTCTCCAG 


GGAGTTAGCA 


ACTAGAGGGG 


GAATATCAAG 


TTCCCACACT 


9051 


CCTCAAAACA 


ATGCAGCCCT 


TGCATTCCTA 


GACACjUvJALZA 




9101 


TGTAGGCTTC 


CCAGTAAGAC 


CTCAAGTGCC 


TCTAAGGCCA 


ATGACCTTTA 


9151 


AAGCAGCCTT 


TGACCTCAGC 


TTCTTTTTAA 


AAGAAAAGGG 


AGGACTGGAT 


9201 


GGGTTAATTT 


ACTCCCATAA 


GAGAGCAGAA 


ATCCTGGATC 


TCTGGATATA 


9251 


TCACACTCAG 


GGATTCTTCC 


CTGATTGGCA 


GTGTTACACA 


CCGGGACCAG 


9301 


GACCTAGATT 


CCCACTGACA 


TTTGGATGGT 


TGTTTAAACT 


GGTACCAGTG 
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9351 


TCAGCAGAAG 


AGGCAGAGAG 


9401 


TCTACATCCA 


GCTTGTAATC 


9451 


TAAAATGGCA 


GTTTGATAGA 


9501 


AAGCACCCAG 


AGCTCTTCCC 


9551 


CTGCTGACAC 


TGCGGGGACT 


9601 


GGGGAGTGGC 


TAACCCTCAG 


9651 


GTACCGGGTC 


TTAGTTAGAG 


9701 


CTCTAGCTGA 


ACCCGCTGCT 


9751 


AAGCAGTGTG 


TGCTCATCTG 



ACTGGGTAAT ACAAATGAAG ATGCTAGTCT 
ATGGAGCTGA GGATGCACAC GGGGAGATAC 
TCATTAGGCT TAACACATAT AGCCCTGCAA 
CAAGTAACTG ACACTGCGGG ACTTTCCAGA 
TTCCAGCGTG GGAGGGATAA GGGGCGGTTC 
ATGCTGCATA TAAGCAGCTG CTTTCCGCTT 
GACCAGGTCT GAGCCCGGGA GCTCCCTGGC 
TAACGCTCAA TAAAGCTTGC CTTGAGTGAG 
TTCAACCCTG GTGTCTAGAG ATC 
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Fiqur 5; PCR AmpllfMerunas. Klo nierunaa. umj SeouenrierunoaBtiateflj * 



v*** p5 180-1 6-30 p°p-» 



s»*3j pS 180- 12-6 W'i 



t J !P p5 180-10-5 s 3 * 11 ' 
» 4 



LTRI p5 180-8-3 ffi«3Ji 

— » 4 — 

LTB ATG ^ao Pn| 
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Fig. 6: obere Zeile entspricht Abb. 4, untere Zeile mit 
PCR-Technik ermittelt (Sequ. No. 57, 58) 



MVP5180 685 



AAACCTCCGACGCAACGGGCTCGGCTTAGCGGAG^ 

Mil 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M I M 1 1 1 1 M 1 1 1 M I M I 

1 kkkcctccakcgcm 



401 acc 



| I I I | | | | I I I I I I M M M I N I I I M I M M ill 

4 5 1 gtaa tggcaagcaggaagtc tgcagaggccgctaaggaagaaacaagctc 



734 
50 



7 3 5 CGAGAGGAACTCAC^VAGAGGGTGAGTAAATTTGCTGGCGGTGGC 784 

M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

5 1 cgagaggaactcacaagagggtgagtaaatttgctggcggtggccagacc 100 



150 
884 



. • • 

785 TAGGGGAAGGGCGAAGTCCCTAGGGGAGGAAGATGGGTGCGAGAGCGTCT 83 4 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M I 1 1 II 

101 taggggaagggcgaagtccctaggggaggaagatgggtgcgagacggtct 

, • • 

835 GTGTTGACAGGGAGTAAATTGGATGCATGGGAACGAAT^ 

1 5 1 gtgttgi UgggigUiit tggatgcatgggaacgaattaggttaaggcc 200 

885 AGGATCTAAAAAGGCATATAGGCTAAAA<^TT^^ 934 
' I I I I I I I I I I I I I I I I I I I I i 1 1! I N Hi iiiU iiiiiiiiiiiiii 250 



I I I I I I I I I | [ | | I I I [ I I I I I I I I I I I I 1 1 i i i i i i i i i i i i ■ 
201 iggatctaaaaaggcatataggctaaaAcatttagtatgggcaagcaggg 

9 3 5 AGCTGGAAAGATACGCATGTAATCCTGGTCTATTAGA 9 8 4 

I 1 1 1 1 I I 1 1 1 I ! I 1 1 1 1 1 I M II M II II M I I I 1 1 1 1 I I 1 1 1 1 M 1 1 orn 

251 Igilggaaagataigiatataatcctggtctactagaaactgcagaaggt 3 00 

. • • 

985 ACTGAGCAACTGCTACAGCAGTTAGAGCCAGCTCTC^ 1034 
3 01 iitgiacaactgcticagcagttagagccagctctcaagacagggtcaga 3 50 

1 03 5 GGACCT GAAATCT CTCT GGAACGC AATAGCAGTACT CTGGTGCGTTCACA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 

3 5 1 ggacctgaaatccctctggaacgcaatagcagtactctggtgcgttcaca 

1 085 ACAGATTTGACATCCGAGATACACAGCAGGCAATACAAAAGTTAAAGGAA 

> I I I | M I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
^gatttgacatccgagatacacagcaggcaatacaaaagttaaaggaa 



1 084 
400 

1 134 
450 



. ■ • 

113 5 GTAATGGC^GCAGGAAGTCTGCAGAGGCCGCTAAGGAAGAAACAAGCCC 1184 

IIIIIIIIIIIIIIMMIIIIIIIIIIIIIIIIIIIIIIIIMIIM I 
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1185 TAGGCAGACAAGTCAAAATTACCCTATAGTAACAAATGCACAGGGACAAA mi 

, ni HI Ml Ml III II 1 1 III I II IIIMIIIIMIM NIMH Mm 1234 

501 aaggcaggcaagtcaaaattaccctatagtaacaaatgcacagggacaaa 550 
1235 TGGTACATCAAGCCATCTCCCCCAGGACTTTAAATGCATGGGTAAAGGCA 1 on a 

MMIMIIMIIIII Mill lllllllllllllllllllllllllll 

bbl tggtacatcaagccatatcccctaggactttaaatgcatgggtaaaggca 6 00 
1 285 GTAGAAGAGAAGGCCTTTAACCCTGAAATTATTCCTATGTTTATGGCATT ma 

cni MINIM IIIIIIIMIIIIIIMIIIIMMIIIIIIMMIIMll 

601 gtagaagaaaaggcctttaaccctgaaattattcctatgtttatggcatt 650 

1335 ATCAGAAGGGGCTGTCCCCTATGATATCAATACCATGCTGAATGCCATAG 1384 
_ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I | | | | | | | | | | | | 
651 atcagaaggggctgtcccctatgatatcaataccatgctgaatgccatag 700 

1385 GGGGACACCAAGGGGCTTTACAAGTGTTGAAGGAAGTAATCAATGAGGAA 1474 

IN M Ml lllllllllllllllllllllllllll Mil MM lllllll 

701 ggggacaccaaggggctttacaagtgttgaaggaagtaatcaatgaggaa 750 
1435 GCAGCAGAATGGGATAGAACTCATCCACCAGCAATGGGGCCGTTACCACC 

, e , IMMIII II I II M II II II II II II II 1 1 II il li II II I II I II II 

751 gcagcagattgggatagaactcatccaccagcaatggggccgttaccacc 800 
1 48 5 AGGGCAGATAAGGGAACCAACAGGAAGTGACATTGCTGGAACAACTAGCA 1C ,, 

fl01 mi i in linn i in i iii i iiiiiiiiiiiiiiiiiiiiiiiiiii 1534 

o u 1 agggcagataagggaaccaacaggaagtgacattgc tggaacaactagca 8 50 
153 5 CACAGCAAGAGCAAATTATATGGACTACTAGAGGGGCTAACTCTATCCCA 1 c o A 

Mil I II II III 1 1 Hi 1 1 III II II I II Mill MM mil | nun 1584 



851 cacagcaagagcaaattatatggactactagaggggctaactctatccca 



900 



1585 GTAGGAGACATCTATAGAAAATGGATAGTGCTAGGACTAAACAAAATGGT i K7 a 

qni IMIIIIIIIIIIIIIIIIIIIIIIIIIII I f 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1634 

9 01 gtaggagacatctatagaaaatggatagtgttaggactaaacaaaatggt 950 

16 3 5 AAAAATGTACAGTCCAGTGAGCATCTTAGATATTAGGCAGGGACCAAAAG 1 c a a 

Qqi ' 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 M I II II I II II II 1 1 1 1 II II II 1 1 II II I II I 

95 1 aaaaatgtacagtccagtgagcatcttagatattaggcagggaccaaaag -j 000 
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1685 AACCATTCAGAGATTATGTAGATCGGTTTTACAAAACATT^ 1734 
' ' ' 1 ' ' ' ' igigittitgtiUtUgUttacaaaacattaagagctgag 



1001 aaccattcac 



1 051 



1 

1101 



1201 cac 



1 251 



1401 



1050 



1735 CAAGCTACTC^GAAGTAAAGAATTGG^ 1784 
iiigiiUUiigiigUaigiittggatgacagaaaccctcgttgttca 



1100 



785 GAATTCAAACCCAGATTGTAAACAAATTCTGAAAGCATTA^ 1834 
UittiiiaiiiagittgUaacaaattctgaaagcattaggaccaggag 



1150 



1835 CTACTTTAgAaGAAATC^ 1884 

2 uiuuiUiuuuiuuiUiUiiii^Ui^i^i^i i 2 oo 

1885 1934 

Liliggiailiiilitigcagaagcaatggcttctgcccagcaagattt , 25 0 



1935 AAAAGGAGGATACACAGCAGTATT<^ 1984 

ill 1 1 1 1 1 1 1 1 1 1 1 1 I Mi 1 1 1 1 1 1 1 1 1 1 1 1 

aaagggaggaUia<^ 1300 



1985 ffiffiffi?^ 2034 

130 1 gaaaaggg<Utataaaaig^ 1350 

1351 iaaaaUgi^agia^ 1400 

iggUiUiiitgiligittgilaaaatggaagacaggctatttttttag 1 4 50 



1451 igUgtUtggiitiiggggggiacgaggccagccaatt^ 1500 
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2185 CAAGTGTCCCCATCAGCCCCACCAATGGAGGAGGCAGTGAAGGAACAAGA 2234 

icn flllllllllllllllllllllllllllllllllllllMIIIIIIIIII 

1501 caagtgtccccatcagccccaccaatggaggaggcagtgaaggaacaaga 1550 
2235 GAATCAGAGTCAGAAGGGGGATCAGGAAGAGCTGTACCCATTTGCCTCCC 2284 

MINIM III IMIIMIIIMIMIIIIIIIIIIIMIIIIIIIII 

1551 gaatcagaatcaaaagggggatcaggaagagctgtacccatttgcctccc 1600 
2285 TCAAATCCCTCTTTGGGACAGACCAATAGTCACAGCAAAGGTTGGGGGTC 23 34 

IMIIMIIIMIIIIIIIIIMMIIIIIIIIIIIIIIIIIIIIIII I 

16 01 tcaaatccctctttgggacagaccaatagtcacagcaaaggttgggggcc 16 5 0 

• • • • * 

2335 ATCTATGTGAGGCTTTACTGGATACAGGGGCAGATGATACAGTATTAAAT 2384 

MIMIMMM MM III MM MIMIMIIM IMMMMIMMI 

1651 atctatgtgaggctttactggatacaggggcagatgatacagtattaaat 1 700 

• • • 

2385 AACATACAATTAGAAGGAAGATGGACACCAAAA 2417 

II III MMMM M M MMM MM i; Ml Ml 

1701 aacatacaattagaaggaagatggacacccaaa 1733 
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Pi a 7- veraleich des gag-Proteins, einmal gemaS Abb. 4 
9 * TjSSeils oben) und einmal mit PCR-Technik (jeweils 
unten) ermittelt (Sequ. ID No. 56, 60) 

MGARASVLTGSKU5AWERIRLRPGS1^ 

I I I I I I I I I I I I I I I I I I I I I I M I : I I I I 

UarrUUgUldaweri^ 

LETAEGTEQLLQQLEPALKTGSEDLKSLWNAIAVLWC^^ 
IQKIJCEVW^RKSAEAA^ETSSTQASQirc 

NAWVKAVEEKAFNPE 1 1 PMFMALSE GAV PYD I N^LNAI GOHQGALQVLK 

EVINEEAAETORTHPPAMGPLPPGQIREPTGSDIAGTTSTQ^ 
lU^^UppiiGUUGiiREUUiiUiUiiiEiliiiiR 

GAMSIPVGDiYRKMIVLG^^^SPVSILDIRQGPraPFroYTORFY 
oiiiipUAi^iUG^^ 

KTLRAEQATQEVlJnflMTETLVVQNSNPDCK^ 

GVGGPTHIU^IIAEAMASAQQDLKGGyTAV^QRGQNPHRKGPIKCFHCG 
KEGHIAMTCRAPRKKGCireCGQEGro^ 

a^qkqUpUppmeeaUeqenqnqkgdqeelypfaslkslfgtdq 
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